Este repositório apresenta uma análise exploratória e modelo de clusterização aplicado aos episódios da série de TV Breaking Bad. Através da análise de variáveis como avaliações no IMDb e audiência nos EUA, este projeto busca identificar padrões, agrupar episódios com características semelhantes e interpretar a recepção do público.
- Realizar uma análise exploratória detalhada dos episódios de Breaking Bad.
- Aplicar um modelo de aprendizado não supervisionado (K-Means) para agrupar episódios semelhantes.
- Interpretar os clusters para fornecer insights sobre a recepção do público e popularidade dos episódios.
O conjunto de dados inclui as seguintes informações:
- Temporada e Episódio: Números correspondentes à temporada e ao episódio.
- Título: Título de cada episódio.
- Duração: Duração do episódio em minutos.
- Avaliação IMDb: Avaliações dos usuários do IMDb para cada episódio.
- Audiência nos EUA (em milhões): Tamanho da audiência nos Estados Unidos.
Enhanced_AnaliseExploratoria_BreakingBad.ipynb
: Notebook Jupyter contendo EDA, visualizações, limpeza de dados, clusterização e interpretação dos clusters.breaking_bad_tv_show_all_seasons_episodes_data.csv
: Arquivo de dados com informações detalhadas sobre cada episódio de Breaking Bad.- README.md: Visão geral dos objetivos do projeto, descrição dos dados e instruções para execução da análise.
- Análise Exploratória (EDA): Exploração inicial dos dados para entender a estrutura e as principais estatísticas.
- Limpeza de Dados: Tratamento de valores ausentes e padronização dos dados.
- Visualização: Representações gráficas, incluindo gráficos de barras, dispersão e histogramas, ilustram distribuições e relações entre variáveis.
- Clusterização: Aplicação do algoritmo K-Means nas variáveis de avaliação IMDb e audiência para agrupar episódios semelhantes.
- Python: Linguagem de programação utilizada para análise e modelagem.
- pandas: Manipulação e análise de dados.
- matplotlib e seaborn: Visualização de dados.
- scikit-learn: Pré-processamento e clusterização K-Means.
Para rodar este projeto localmente:
- Clone este repositório: Use
git clone https://github.com/MarsoL4/breaking-bad-analysis.git
. - Configure o ambiente:
- Certifique-se de ter Python e Jupyter Notebook instalados.
- Instale as bibliotecas necessárias com o comando:
pip install pandas matplotlib seaborn scikit-learn
- Abra e execute o Notebook: Abra o arquivo
Enhanced_AnaliseExploratoria_BreakingBad.ipynb
no Jupyter Notebook ou Google Colab e execute cada célula na sequência.
Alternativamente, você pode utilizar Google Colab para executar o notebook diretamente no navegador.
Explore o notebook e sinta-se à vontade para personalizar a análise e descobrir novos insights!