Analisando e categorizando documentos da SEFAZ

Descrição:

O projeto propõe-se a analisar o corpo de uma série de documentos da Secretaria da Fazenda do Estado do Ceará, para classificá-los de acordo com seu tipo (Lei, Norma, Decreto, etc).

Este é um trabalho acadêmico da disciplina CK0223 - Mineração de Dados (DC/UFC, 2020.1).

Documentos Analisados:

Os documentos analisados estão disponíveis em:

https://drive.google.com/drive/folders/1mxz5MpdueJuEMB1AFCQhhxgWmdVSydpC?usp=sharing

E foram obtidos pelo link:

http://www2.sefaz.ce.gov.br/alfrescoPublic/br.com.alfresco.FormMain/FormMain.html

Tecnologias utilizadas:

Python 3:
- PdfPlumber
- Numpy
- Pandas
- Seaborn
- Scikit-Learn

Como reproduzir?

Para reproduzir, basta executar os seguintes passos:

Clonar o repositório usando o git:

git clone https://github.com/romulofff/datascience_trabalho_sefaz.git

Instalar as bibliotecas utilizadas no tutorial e criar o ambiente virtual usando:

pip install -r requirements.txt

Navegar até a pasta notebooks/ e executar o Jupyter com:

jupyter notebook

Basta então abrir os notebooks e executar as células.

Name		Name	Last commit message	Last commit date
Latest commit History 97 Commits
__pycache__		__pycache__
notebooks		notebooks
slides		slides
.gitignore		.gitignore
README.md		README.md
dataset.csv		dataset.csv
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Analisando e categorizando documentos da SEFAZ

Descrição:

Documentos Analisados:

Tecnologias utilizadas:

Como reproduzir?

About

Uh oh!

Uh oh!

Contributors 5

Uh oh!

Languages

romulofff/datascience_trabalho_sefaz

Folders and files

Latest commit

History

Repository files navigation

Analisando e categorizando documentos da SEFAZ

Descrição:

Documentos Analisados:

Tecnologias utilizadas:

Como reproduzir?

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Uh oh!

Contributors 5

Uh oh!

Languages