Descrição: Criar um script em Python (extract_wikipedia.py) que utilize raspa a página da Wikipedia para obter top 100 músicas de cada ano. Link: https://en.wikipedia.org/wiki/Billboard_Year-End_Hot_100_singles_of_2024
Descrição: Criar um script em Python (extract_lyrics.py) utilizando a API Lyricsovh para extrair as letras das músicas..
Descrição: Integrar a API do Last.fm para obter dados sobre as músicas, como a quantidade de ouvintes, o número de vezes que a música foi tocada, o gênero musical e a data de publicação.
Descrição: Criar um script (transform.py) para limpar e transformar os dados extraídos, incluindo normalização de formatos (ex.: data de lançamento das músicas), remoção de duplicatas e organização dos dados para análise no BigQuery.
Descrição: Criar um script (load.py) para carregar os dados transformados no BigQuery.
Descrição: Utilizar técnicas de NLP (Natural Language Processing) para realizar análise de sentimentos nas letras das músicas extraídas. Isso inclui a análise de palavras positivas, negativas e neutras, identificando a emoção predominante nas músicas.
Descrição: Implementar técnicas de modelagem de tópicos (ex.: LDA - Latent Dirichlet Allocation) para identificar os principais tópicos discutidos nas letras das músicas. Isso pode ajudar a entender melhor sobre o que as músicas falam (amor, sociedade, protesto, etc.).
Descrição: Criar dashboards interativos e visualizações no Power BI para exibir as análises de dados feitas a partir das letras das músicas (como análise de sentimentos, tópicos e popularidade das faixas), além de ouvintes, qual a mudança teve ao longo dos anos.