📊 Carga Tributária LLM

Este é um projeto de demonstração de RAG (Retrieval-Augmented Generation) utilizando LangChain, Ollama, FAISS e Streamlit para permitir consultas inteligentes a dados tributários estruturados (CSV) e semiestruturados (PDFs).

🔧 Tecnologias Utilizadas

📁 Estrutura de Pastas

carga_tributaria_llm/
│
├── core/                      # Módulos principais do sistema
│   ├── constants.py           # Caminhos e constantes globais
│   ├── document_loader.py     # Carregamento e conversão de CSV e PDF para documentos LangChain
│   ├── vectorstore_manager.py # Indexação e carregamento do vetor FAISS
│   ├── llm_service.py         # Interface com o modelo LLM via Ollama
│   ├── utils.py               # Funções utilitárias (ex: limpeza de texto)
│
├── datasets/                  # Arquivos de dados
│   ├── *.csv                  # Tabelas tributárias
│   ├── *.pdf                  # Metadados das tabelas
│
├── faiss_datasets/            # Persistência do índice FAISS
│
├── app.py                     # Aplicação principal Streamlit
├── requirements.txt           # Dependências do projeto
├── README.md                  # Este arquivo
└── .gitignore                 # Exclusões do Git

🚀 Como Executar

1. Requisitos

Python 3.10+
Ambiente virtual configurado
Ollama instalado e rodando

2. Instalação

git clone https://github.com/lsprdev/carga_tributaria_llm.git
cd carga_tributaria_llm
python -m venv venv
source venv/bin/activate  # No Windows: venv\Scripts\activate
pip install -r requirements.txt

3. Executar a aplicação

streamlit run app.py

O sistema irá carregar ou construir automaticamente o índice FAISS a partir dos arquivos CSV e PDF na pasta datasets/.

💡 Como Funciona?

Os arquivos CSV e PDF são carregados como documentos LangChain.
É criado um índice vetorial FAISS com embeddings via nomic-embed-text (Ollama).
O usuário digita uma pergunta na interface Streamlit.
O sistema busca os documentos relevantes e envia o contexto ao modelo LLM (deepseek-r1:8b).
O modelo retorna uma resposta com base nos dados.

📌 Observações

O modelo precisa estar carregado localmente via Ollama (ollama run deepseek-r1:8b).
O carregamento inicial pode levar alguns segundos, pois envolve leitura e indexação de documentos.
O sistema ainda é uma prova de conceito e pode ser expandido para adicionar upload de arquivos ou histórico de respostas.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

📊 Carga Tributária LLM

🔧 Tecnologias Utilizadas

📁 Estrutura de Pastas

🚀 Como Executar

1. Requisitos

2. Instalação

3. Executar a aplicação

💡 Como Funciona?

📌 Observações

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
core		core
datasets		datasets
faiss_datasets		faiss_datasets
.gitignore		.gitignore
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt

lsprdev/carga_tributaria_llm

Folders and files

Latest commit

History

Repository files navigation

📊 Carga Tributária LLM

🔧 Tecnologias Utilizadas

📁 Estrutura de Pastas

🚀 Como Executar

1. Requisitos

2. Instalação

3. Executar a aplicação

💡 Como Funciona?

📌 Observações

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages