Skip to content

zec4o/fuel-data-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

UNIVERSIDADE DO SUL DE SANTA CATARINA

Alunos:
Amanda Espíndola
João Vitor dos Santos Klausen
José Malty Soares

Orientadores:
Prof. Jorge Werner
Prof. Cláudio Henrique da Silva



Florianópolis, 2024

Introdução

O presente trabalho, intitulado "Análise dos Custos dos Combustíveis como Indicador de Sustentabilidade e Oportunidades de Inovação", tem como objetivo explorar e analisar os preços dos combustíveis no Brasil ao longo dos anos, com um enfoque especial na sustentabilidade ambiental e nas oportunidades de inovação decorrentes dessa análise. Este projeto é uma exigência da unidade curricular Análise de Dados e Big Data, ministrada na Universidade do Sul de Santa Catarina (UNISUL), pelos Professores Cláudio Henrique da Silva e Jorge Werner, e visa alinhar-se a pelo menos um dos Objetivos de Desenvolvimento Sustentável (ODS) da ONU, promovendo uma visão ética e inovadora no uso dos dados.

A escolha do tema foi motivada pela relevância crescente da sustentabilidade ambiental no contexto global e pela necessidade de se explorar alternativas mais ecológicas e economicamente viáveis no setor de combustíveis. A análise cobre um período extenso, de 2004 a 2020, permitindo uma visão detalhada das tendências de preços, influências econômicas e políticas, e impactos ambientais associados ao uso de diferentes tipos de combustíveis, incluindo gasolina, etanol, diesel e gás natural veicular (GNV).

Objetivos do Trabalho

Os principais objetivos deste trabalho são:

Analisar a Evolução dos Preços dos Combustíveis: Identificar tendências de preços e suas variações ao longo do tempo, correlacionando-as com eventos econômicos, políticos e ambientais significativos. Avaliar a Sustentabilidade dos Combustíveis: Comparar as emissões de CO2 e os custos por quilômetro dos diferentes combustíveis, destacando as opções mais sustentáveis e economicamente vantajosas. Propor Oportunidades de Inovação: Baseando-se nos dados analisados, sugerir inovações e políticas que possam promover o uso de combustíveis mais sustentáveis e eficientes. # #

Metodologia

Para atingir esses objetivos, a metodologia empregada inclui:

  • Coleta de Dados: Os dados foram obtidos de fontes confiáveis, incluindo bases de dados governamentais e relatórios de mercado.
  • Preparação dos Dados: Foi realizada a limpeza e padronização dos dados, tratando valores ausentes e removendo duplicatas, para garantir a qualidade das análises subsequentes.
  • Análise Exploratória de Dados: Utilizamos técnicas de análise exploratória para entender a distribuição das variáveis, identificar outliers e explorar tendências iniciais.
  • Análise Estatística Descritiva: Calculamos métricas estatísticas relevantes, como médias, medianas, desvios padrão e correlações, apresentando-as de forma clara e concisa através de gráficos e tabelas.
  • Seleção de Técnicas de Análise: Optamos por técnicas de análise temporal e majoritariamente gráficos de linha, que se mostraram eficazes para visualizar as variações dos preços dos combustíveis ao longo do tempo.
  • Ferramentas Utilizadas: Todas as análises foram realizadas utilizando Python e suas bibliotecas, que permitiram uma análise eficiente e reprodutível.

Resultados Esperados

Espera-se que este trabalho forneça uma compreensão aprofundada das dinâmicas de preços dos combustíveis no Brasil, evidenciando como fatores econômicos e políticas públicas influenciam esses preços. Além disso, a análise deve destacar a importância da sustentabilidade no setor de combustíveis, propondo soluções inovadoras que possam reduzir as emissões de CO2 e promover o uso de alternativas mais ecológicas.

Relevância do Trabalho

A relevância deste trabalho reside na sua capacidade de fornecer dados interpretados tanto para consumidores quanto para formuladores de políticas, ajudando a tomar decisões informadas que equilibram a necessidade de desenvolvimento econômico com a urgência de práticas mais sustentáveis. Ao vincular a análise dos preços dos combustíveis aos Objetivos de Desenvolvimento Sustentável, este projeto não só cumpre os requisitos acadêmicos, mas também contribui para uma discussão mais ampla sobre sustentabilidade e inovação no setor de energia.

Com isso, esperamos que nosso estudo sirva como uma base sólida para futuras pesquisas e iniciativas que visem a sustentabilidade ambiental e a eficiência econômica no uso de combustíveis.

Definição do Escopo e Objetivo

Este projeto tem como objetivo investigar a viabilidade econômica e ambiental do uso de combustíveis sustentáveis, como o etanol, em comparação com combustíveis tradicionais, como a gasolina. O escopo desta análise está definido para identificar os momentos em que o uso de combustíveis com menor autonomia, mas mais sustentáveis, se torna mais vantajoso, levando em consideração os preços dos combustíveis ao longo do tempo.

A análise se concentrará em responder a perguntas específicas, como: Em que circunstâncias o uso de combustíveis sustentáveis é mais econômico? Como os preços dos combustíveis variam ao longo do tempo e afetam essa viabilidade econômica?

Coleta e Preparação dos Dados

Para nosso projeto, selecionamos o dataset "Preços de Combustíveis Brasil" disponível no site Kaggle, uma fonte confiável e reconhecida internacionalmente pela qualidade e diversidade dos seus datasets, garantindo a relevância dos dados para nosso escopo. Realizamos uma série de etapas de limpeza dos dados para assegurar a qualidade da análise. Identificamos e tratamos valores ausentes, preenchendo com médias ou medianas conforme apropriado, ou removendo registros incompletos quando necessário. Além disso, removemos duplicatas para evitar distorções causadas por dados repetidos, e padronizamos os formatos de dados para assegurar consistência e facilitar a análise.

Referência do Dataset: DataSet Gas Prices In Brazil

Tecnologia

Durante a execução desse trabalho utilizamos ao todo 3 tecnologias, sendo elas:

-Microsoft Excel: Utilizado na demonstração dos dados e exploração;

-Microsoft Word: Utilizado para elaboração da documentação e demonstração de alguns gráficos;

-Python: O Python junto com as bibliotecas matplotlib, pandas, scipy, numpy e seaborn, foi utilizado para interpretar, limpar e plotar os dados.

Exploração Inicial dos Dados

A análise exploratória inicial dos dados de preços de combustíveis apresenta uma visão abrangente e detalhada dos valores de distribuição, revenda e margem de lucro de quatro tipos de combustíveis ao longo do tempo. Nesta seção, são apresentados os resultados obtidos, destacando as tendências de compra, os valores médios, mínimos e máximos, bem como a comparação entre combustíveis sustentáveis (Etanol e GNV) e poluentes (Gasolina e Diesel S10). Esses dados fornecem insights valiosos sobre o mercado de combustíveis, possibilitando uma compreensão mais aprofundada dos padrões de consumo e do impacto ambiental das escolhas de abastecimento.

Distribuição das Variáveis

Realizado levantamento dos valores médios, mínimos e máximos dos combustíveis, onde podemos identificar tendências de compra. Realizamos a pesquisa dando ênfase em quatro combustíveis, sendo 2 sustentáveis (Etanol e GNV) e 2 altamente poluentes (Gasolina e Diesel).

Segue um instrutivo para interpretação dos dados:

-Distribuição: Valor no qual o posto compra o combustível das refinarias;

-Revenda: Valor no qual chegará para o consumidor;

-Valor médio da margem de lucro: Valor de revenda – Valor de distribuição.

  1. ETANOL HIDRATADO

-Preço Médio de distribuição- R$2.05;

-Preço Mínimo de distribuição- R$0.57;

-Preço Máximo de distribuição- R$4.07;

-Preço Médio revenda- R$2.38;

-Preço Mínimo revenda- R$0.76;

-Preço Máximo revenda- R$4.43;

-Valor médio da margem de lucro- R$;

  1. GNV

-Preço Médio de distribuição- R$1.40;

-Preço Mínimo de distribuição- R$0.50;

-Preço Máximo de distribuição- R$4.21;

-Preço Médio revenda- R$1.91;

-Preço Mínimo revenda- R$0.97;

-Preço Máximo revenda- R$4.77;

-Valor médio da margem de lucro- R$0.51;

  1. DIESEL S10

-Preço Médio de distribuição- R$2.77;

-Preço Mínimo de distribuição- R$1.89;

-Preço Máximo de distribuição- R$4.47;

-Preço Médio revenda- R$3.14;

-Preço Mínimo revenda- R$2.13;

-Preço Máximo revenda- R$4.87;

-Valor médio da margem de lucro- R$1.01;

  1. GASOLINA COMUM

-Preço Médio de distribuição- R$2.72;

-Preço Mínimo de distribuição- R$1.63;

-Preço Máximo de distribuição- R$4.6;

-Preço Médio de revenda - R$3.13;

-Preço Mínimo de revenda - R$1.88;

-Preço Máximo de revenda - R$5.36;

-Valor médio da margem de lucro- R$0,41;

Análise Estatística Descritiva

A análise estatística descritiva complementa a análise exploratória inicial, permitindo uma compreensão mais profunda dos dados de preços de combustíveis e de suas implicações, especialmente no que diz respeito à sustentabilidade ambiental. Mesmo sem dados específicos de consumo, é possível extrair insights valiosos, como demonstrado no gráfico de emissão total de CO2 para um tanque abastecido com 50 reais e na comparação do custo por km entre os diferentes tipos de combustível por quadrimestre.

Uma das descobertas significativas é a redução expressiva nas emissões de CO2 ao optar pelo álcool em vez da gasolina. Com o aumento dos preços dos combustíveis e as melhorias nos carros flex, a emissão de CO2 ao abastecer um veículo com álcool é quase 50% menor do que ao abastecer com gasolina. Esse dado ressalta a importância das escolhas de combustível na redução das emissões de gases de efeito estufa e no combate às mudanças climáticas. Além disso, evidencia a relevância de políticas públicas e incentivos para promover o uso de combustíveis mais sustentáveis.

Além disso, durante o período entre 2007 e 2010, o Brasil passou por uma conjuntura econômica e política que impactou significativamente o mercado de combustíveis. A alta do dólar e do preço do petróleo no mercado internacional contribuíram para o aumento dos custos de produção e, consequentemente, para o encarecimento da gasolina.

Nesse contexto, as políticas públicas do governo Lula desempenharam um papel fundamental ao incentivar pesquisas e investimentos no setor de etanol. O Programa Nacional de Produção e Uso do Biodiesel (PNPB) e o Programa de Incentivo aos Biocombustíveis (Proálcool) foram algumas das iniciativas que impulsionaram a produção e o consumo de etanol no país.

Além disso, houve avanços significativos na tecnologia dos motores flex, que permitiram uma maior eficiência no consumo de etanol, tornando-o mais competitivo em relação à gasolina. Isso se traduziu em um custo por quilômetro rodado mais baixo para os consumidores que optaram pelo etanol, especialmente considerando os altos preços da gasolina na época.

Essa mudança no cenário dos combustíveis no Brasil evidencia a importância das políticas públicas e dos avanços tecnológicos na determinação da viabilidade econômica e ambiental dos diferentes tipos de combustíveis. A análise estatística desses dados permite compreender como esses fatores externos influenciam as escolhas dos consumidores e como o mercado de combustíveis responde a essas condições.

Para além dos tópicos de sustentabilidade ambiental, ao longo do período de 2004 a 2020, o mercado de combustíveis no Brasil foi influenciado por uma série de eventos, incluindo políticas públicas e crises econômicas, que impactaram os preços médios, mínimos e máximos da gasolina e do etanol.

Políticas Públicas e Crises:

  1. 2004-2008 - Expansão do Proálcool: Durante esse período, houve uma expansão significativa do Programa Nacional do Álcool (Proálcool), impulsionado pelo aumento dos preços do petróleo. Isso resultou em uma redução relativa dos preços do etanol em comparação com a gasolina, tornando-o mais atraente para os consumidores.
  2. 2008 - Crise Econômica Global: A crise financeira global de 2008 teve um impacto significativo nos preços dos combustíveis, levando a uma redução temporária dos preços tanto da gasolina quanto do etanol.
  3. 2011-2014 - Subsídios ao Diesel: Durante esse período, o governo brasileiro implementou uma política de subsídios ao diesel, o que levou a um aumento nos preços da gasolina e do etanol para compensar essa política.
  4. 2014-2016 - Crise econômica no Brasil: A crise econômica enfrentada pelo Brasil nesse período resultou em aumentos substanciais nos preços dos combustíveis, devido à desvalorização da moeda e à instabilidade econômica.
  5. 2018 - Greve dos Caminhoneiros: A greve dos caminhoneiros em 2018 teve um impacto significativo nos preços dos combustíveis, com aumentos expressivos tanto na gasolina quanto no etanol.
  6. 2020 - Pandemia de COVID-19: A pandemia de COVID-19 causou uma queda drástica na demanda por combustíveis, levando a uma redução nos preços da gasolina e do etanol.

Impacto nos Preços:

Esses eventos e políticas públicas tiveram um impacto direto nos preços médios, mínimos e máximos da gasolina e do etanol ao longo do tempo. A análise desses dados revela as flutuações e tendências dos preços, proporcionando insights sobre as dinâmicas do mercado de combustíveis no Brasil e como ele é afetado diante de eventos marcantes.

A análise estatística descritiva dos dados de preços de combustíveis no Brasil, abrangendo o período de 2004 a 2020, evidencia como políticas públicas, crises econômicas e avanços tecnológicos influenciaram significativamente o mercado de combustíveis. Ao examinar os preços médios, mínimos e máximos da gasolina e do etanol, foi possível identificar períodos de estabilidade e volatilidade, refletindo as condições econômicas e políticas vigentes.

Além das questões econômicas, a análise também destacou aspectos importantes da sustentabilidade ambiental. A comparação das emissões de CO2 e do custo por quilômetro entre gasolina, etanol e GNV revelou que escolhas de combustíveis mais sustentáveis, como o etanol e o GNV, não apenas reduzem as emissões de gases de efeito estufa, mas também podem ser financeiramente vantajosas em determinados contextos.

O período de 2006 a 2010, em particular, demonstrou como incentivos governamentais e melhorias tecnológicas podem tornar o etanol uma alternativa mais atraente à gasolina, tanto em termos econômicos quanto ambientais. A análise dos preços de combustíveis ao longo do tempo também sublinhou a importância de políticas públicas consistentes para promover a adoção de combustíveis mais sustentáveis e economicamente viáveis.

Em resumo, a análise estatística descritiva proporciona uma compreensão abrangente das dinâmicas do mercado de combustíveis no Brasil, oferecendo insights valiosos para formuladores de políticas, empresas e consumidores na tomada de decisões informadas sobre o uso de combustíveis.

Seleção de Técnicas de Análise

Para realizar a análise do dataset de preços de combustíveis, utilizamos uma abordagem sistemática e abrangente, empregando diversas técnicas de análise e ferramentas, todas implementadas em Python. A seguir, descrevemos as principais técnicas de análise utilizadas neste trabalho:

Limpeza do Dataset

  1. Carregamento e Inspeção dos Dados: Utilizamos bibliotecas como pandas para carregar o dataset e realizar uma inspeção inicial dos dados. Esta etapa incluiu a verificação de valores nulos, tipos de dados e a identificação de inconsistências.
  2. Tratamento de Dados Faltantes ou Incorretos: Implementamos técnicas de remoção para lidar com valores nulos, removendo-os, visto que eram poucos registros incorretos diante da imensidão de dados neste dataset.
  3. Remoção de Outliers: Utilizamos métodos estatísticos, como o Z-score e o IQR (Interquartile Range), para identificar e remover outliers que poderiam distorcer a análise.
  4. Correção de Valores Incorretos: Empregamos filtros e condições para corrigir ou remover valores que estavam fora dos intervalos aceitáveis ou que não faziam sentido no contexto dos dados (e.g., preços negativos).

Análise Exploratória dos Dados (EDA)

Distribuição das Variáveis: Inicialmente, utilizamos histogramas e boxplots para visualizar a distribuição dos preços de combustíveis e identificar possíveis outliers.

Visualização de Dados: Majoritariamente, utilizamos gráficos de linha, pois eles se mostraram mais eficazes para visualizar a evolução dos preços ao longo do tempo. Esses gráficos permitiram identificar tendências e flutuações sazonais de maneira clara e intuitiva.

Análise de Sustentabilidade Ambiental

  1. Emissão de CO2: Calculamos as emissões de CO2 para um tanque abastecido com 50 reais, utilizando fatores de emissão específicos para cada tipo de combustível.

  2. Custo por Quilômetro: Comparamos o custo por quilômetro entre gasolina, etanol e GNV por quadrimestre, utilizando fórmulas que consideram o preço do combustível e a eficiência média dos veículos.

  3. Análise Histórica:

    1. 2006-2010: Observamos que, devido a fatores como a alta do dólar, alta do petróleo e políticas públicas do governo Lula, era mais barato investir em etanol. Essas políticas incentivaram pesquisas e melhorias nos motores flex, aumentando a eficiência do etanol e tornando-o uma opção mais econômica e sustentável.
    2. 2004-2022: A análise ao longo desse período mostrou como políticas públicas e crises econômicas afetaram os preços dos combustíveis. Utilizamos gráficos de linha para evidenciar essas flutuações e analisar o impacto das crises econômicas, como a crise global de 2008, a crise econômica no Brasil entre 2014 e 2016, e a pandemia de COVID-19 em 2020.
  4. Implementação com Python Todas as etapas foram implementadas em Python utilizando as seguintes bibliotecas:

  • pandas para manipulação e limpeza de dados.
  • numpy para cálculos numéricos e estatísticos.
  • matplotlib e seaborn para visualização de dados, com foco em gráficos de linha.
  • scipy para técnicas avançadas de estatística e remoção de outliers.

A escolha de gráficos de linha como principal ferramenta de visualização permitiu uma análise clara e detalhada da evolução dos preços ao longo do tempo, proporcionando a visualização das tendências do mercado de combustíveis e suas implicações econômicas e ambientais. A utilização de Python garantiu a eficiência e a reprodutibilidade da análise, permitindo uma abordagem robusta e consistente para a interpretação dos dados, bem como o Microsoft Excel para as análises manuais do grupo.

Conclusão

O estudo "Análise dos Custos dos Combustíveis como Indicador de Sustentabilidade e Oportunidades de Inovação" abordou de maneira abrangente a evolução dos preços dos combustíveis no Brasil de 2004 a 2020, com um enfoque na sustentabilidade ambiental e nas oportunidades de inovação. Utilizando dados confiáveis e técnicas robustas de análise estatística e exploratória, foi possível identificar tendências e influências significativas, tanto econômicas quanto políticas, no mercado de combustíveis.

A análise revelou que escolhas de combustíveis mais sustentáveis, como etanol e GNV, não apenas reduzem as emissões de CO2, mas também podem ser economicamente vantajosas em certos contextos. Por exemplo, a substituição da gasolina pelo etanol pode reduzir quase 50% das emissões de CO2, evidenciando a importância de políticas públicas e incentivos para promover combustíveis mais ecológicos.

O impacto de eventos como a crise econômica global de 2008, a greve dos caminhoneiros em 2018 e a pandemia de COVID-19 em 2020, bem como políticas públicas como os subsídios ao diesel, foram detalhadamente analisados. Essas situações demonstraram como fatores externos influenciam significativamente os preços dos combustíveis e, consequentemente, as escolhas dos consumidores.

Os avanços tecnológicos e os incentivos governamentais, especialmente entre 2006 e 2010, mostraram-se essenciais para tornar o etanol uma alternativa viável à gasolina. O estudo sublinha a necessidade de políticas públicas consistentes para fomentar a adoção de combustíveis sustentáveis e economicamente viáveis, ressaltando que o desenvolvimento sustentável no setor de combustíveis não depende apenas de inovações tecnológicas, mas também de um arcabouço regulatório favorável.

Para aqueles interessados em explorar mais a fundo os dados e as análises realizadas, disponibilizamos o repositório do projeto para download. O repositório inclui o conjunto de dados utilizado, o código fonte em Python, bem como a documentação completa do projeto. Ele pode ser acessado através do seguinte link: Repositório do Projeto no GitHub.

Portanto, este trabalho não só cumpre seus objetivos acadêmicos, mas também contribui para a discussão sobre sustentabilidade e inovação no setor energético, oferecendo insights valiosos para formuladores de políticas, empresas e consumidores. Esperamos que os resultados aqui apresentados sirvam como base sólida para futuras pesquisas e iniciativas que visem a sustentabilidade ambiental e a eficiência econômica no uso de combustíveis.

Referências

Gas Prices in Brazil. Disponível em: https://www.kaggle.com/datasets/matheusfreitag/gas-prices-in-brazil. Acesso em: 20 mai. 2024.

Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (ANP). Dados Estatísticos. Disponível em: http://www.anp.gov.br/dados-estatisticos Acesso em: 10 jun. 2024.

Instituto Brasileiro de Geografia e Estatística (IBGE). Indicadores Econômicos. Disponível em: https://www.ibge.gov.br/indicadores.html Acesso em: 10 jun. 2024.

Python Software Foundation. Python Documentation. Disponível em: https://docs.python.org/3 Acesso em: 10 jun. 2024.

Ministério de Minas e Energia. Política Energética Nacional. Disponível em: https://www.gov.br/mme/pt-br. Acesso em: 20 mai. 2024.

About

A brief data analysis about the fuel prices in Brazil the last 20 years ⛽

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published