-
src/
: Scripts Python do projetoextract_pdf_text.py
: Extrai texto de PDFsdownload_source.py
: Baixa artigos das fontes (avaliar necessidade)gera_graf.py
: Gera visualizaçõespesquisa_artigos_scholar.py
: Busca no Google Scholarverify_downloads.py
: Verifica downloads
-
data/
: Dados brutos e intermediáriosarticles.json
: Artigos coletadosscholar_search_results.json
: Resultados de buscas (avaliar necessidade)
-
output/
: Resultados atuais da análise (textos extraídos) -
archive/
: Análises e resultados anteriores -
novas_fontes/
: Novos materiais para análisepdfs/
: PDFs das novas fontes
-
patterns/
: Padrões do Fabric para análise -
pdf/
: PDFs originais do projeto
- Instale as dependências:
pip install -r requirements.txt
- Pipeline principal:
# Gerar relatórios individuais
python src/generate_reports.py
# Consolidar dados
python src/process_reports.py
# Gerar visualizações
python src/gera_graf.py
- Estrutura de arquivos:
data/reports/raw/
: Relatórios individuais em Markdowndata/reports/consolidated.json
: Dados consolidadosoutput/
: Gráficos e visualizações
- Para atualizar o repositório:
git add .
git commit -m "Mensagem descritiva"
git push origin main
apenas uma atualização para rodar o workflow