Skip to content

danielzunarelli/Data_Quality_Project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Projeto Data Quality - ADA Tech // Santander Coders 2024

Objetivo:

O objetivo do projeto é criar uma ferramenta de análise de qualidade de dados usando programação orientada a objetos (POO) em Python, para tornar a análise e visualização de datasets mais organizada e automatizada.

Arquitetura:

O projeto é composto de duas partes principais:

Arquivo dataquality.py: Este arquivo contém a classe DataQuality, que realiza toda a análise de dados, como contagem de valores nulos, valores únicos, distribuição de categorias e descrição de colunas numéricas. Ele também gera gráficos para facilitar a visualização das informações.

Jupyter Notebook: O notebook será o ponto onde você carrega o seu dataset e usa a classe DataQuality para analisar os dados com base em um conjunto de métodos predefinidos. O notebook não terá poluição visual, pois todo o código complexo estará encapsulado no módulo dataquality.py.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published