Skip to content

Programmer-Girls/projeto-de-dados-billboard

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 

Repository files navigation

Projeto de Dados da ProGirls

Equipe de Engenharia de dados

Extração de Dados (Web Scraping e APIs)

Tarefa 1: Extração de Dados da Wikipedia

Descrição: Criar um script em Python (extract_wikipedia.py) que utilize raspa a página da Wikipedia para obter top 100 músicas de cada ano. Link: https://en.wikipedia.org/wiki/Billboard_Year-End_Hot_100_singles_of_2024

Tarefa 2: Retornar Letras Musicais

Descrição: Criar um script em Python (extract_lyrics.py) utilizando a API Lyricsovh para extrair as letras das músicas..

Tarefa 3: Utilização da API do Last.fm

Descrição: Integrar a API do Last.fm para obter dados sobre as músicas, como a quantidade de ouvintes, o número de vezes que a música foi tocada, o gênero musical e a data de publicação.

Transformação de Dados

Tarefa 4: Limpeza e Transformação dos Dados

Descrição: Criar um script (transform.py) para limpar e transformar os dados extraídos, incluindo normalização de formatos (ex.: data de lançamento das músicas), remoção de duplicatas e organização dos dados para análise no BigQuery.

Carregamento de Dados

Tarefa 5: Carregar Dados no BigQuery

Descrição: Criar um script (load.py) para carregar os dados transformados no BigQuery.

Equipe de ciência de dados

Tarefa: Análise de Sentimento nas Letras Musicais

Descrição: Utilizar técnicas de NLP (Natural Language Processing) para realizar análise de sentimentos nas letras das músicas extraídas. Isso inclui a análise de palavras positivas, negativas e neutras, identificando a emoção predominante nas músicas.

Tarefa: Análise de Tópicos nas Letras Musicais

Descrição: Implementar técnicas de modelagem de tópicos (ex.: LDA - Latent Dirichlet Allocation) para identificar os principais tópicos discutidos nas letras das músicas. Isso pode ajudar a entender melhor sobre o que as músicas falam (amor, sociedade, protesto, etc.).

Equipe de análise de dados

Tarefa: Criação de Visualizações no Power BI

Descrição: Criar dashboards interativos e visualizações no Power BI para exibir as análises de dados feitas a partir das letras das músicas (como análise de sentimentos, tópicos e popularidade das faixas), além de ouvintes, qual a mudança teve ao longo dos anos.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published