O objetivo do projeto é criar uma ferramenta de análise de qualidade de dados usando programação orientada a objetos (POO) em Python, para tornar a análise e visualização de datasets mais organizada e automatizada.
O projeto é composto de duas partes principais:
Arquivo dataquality.py: Este arquivo contém a classe DataQuality, que realiza toda a análise de dados, como contagem de valores nulos, valores únicos, distribuição de categorias e descrição de colunas numéricas. Ele também gera gráficos para facilitar a visualização das informações.
Jupyter Notebook: O notebook será o ponto onde você carrega o seu dataset e usa a classe DataQuality para analisar os dados com base em um conjunto de métodos predefinidos. O notebook não terá poluição visual, pois todo o código complexo estará encapsulado no módulo dataquality.py.