Este repositorio contiene el material formativo del Programa IMPACT#IA de la Fundación GoodJob, una organización sin ánimo de lucro dedicada a fomentar la inclusión laboral de personas con discapacidad mediante la tecnología.
Capacitar a los alumnos para la empleabilidad en roles tecnológicos, desarrollando competencias en el uso de la Inteligencia Artificial y en herramientas clave del ecosistema actual.
Sesión | Fecha | Contenido Principal |
---|---|---|
📌 Sesión 1 | 15 septiembre | - Introducción a llama-index - Introducción a LangChain y LangGraph - Otros frameworks (Agno, etc.) |
🎯 Sesión 2 (este repositorio) | 16 septiembre | - Uso de APIs con llama-index - Agentes con llama-index - Refresco Pydantic - Parseo documental con IA |
📌 Sesión 3 | 17 septiembre | - Automatización con N8N - N8N + llama-index (cadena de agentes) - Modelo MCP/A2A |
📌 Sesión 4 | 18 septiembre | - Agentes avanzados con más @tools - Ampliación del parseo con Pydantic |
curso-llamaindex-pydantic/
├── 📓 notebooks/ # Material principal en Jupyter Notebooks
│ ├── 01_uso_apis_llamaindex.ipynb
│ ├── 02_agentes_llamaindex.ipynb
│ ├── 03_refresco_pydantic.ipynb
│ ├── 04_parseo_documentos.ipynb
│ └── sources/ # Recursos visuales (diagramas, imágenes)
├── 🏋️ exercises/ # Ejercicios prácticos
│ ├── bloque1_apis/ # Ejercicio de APIs con NewsAPI
│ ├── bloque1_agentes/ # Ejercicio de agentes multi-sistema
│ ├── bloque2_pydantic/ # Ejercicio de validación avanzada
│ └── bloque2_parseo/ # Ejercicio de parseo web con LLM
│ ├── enunciado.md
│ └─ template.py
├── ✅ solutions/ # Soluciones completas de los ejercicios
│ ├── bloque1_apis_sol.py
│ ├── bloque1_agentes_sol.py
│ ├── bloque2_pydantic_sol.py
│ └── bloque2_parseo_sol.py
├── 🔧 src/ # Código fuente del curso
│ ├── apis/ # APIs integradas (NewsAPI, WeatherAPI)
│ ├── embeddings/ # Modelos de embeddings
│ └── string_utils.py # Utilidades de procesamiento
├── 🏗️ models/ # Modelos Pydantic de ejemplo
│ ├── earnings_model.py
│ └── radiohead.py
├── 📊 data/ # Datasets de ejemplo
│ ├── radiohead.json # Dataset principal para parseo
│ ├── BOE-A-1978-31229-consolidado.pdf
│
├── 🗄️ chroma_db/ # Base de datos vectorial ChromaDB
├── 🕷️ llamaindex_docs_crawler/ # Web scraper para documentación
├── requirements.txt # Dependencias Python
└── setup_instructions.md # Guía de configuración detallada
- Objetivo: Implementar un agente que busque noticias en tiempo real
- Tecnologías: NewsAPI, LlamaIndex, agentes conversacionales
- Funcionalidades: Configuración LLM, integración de herramientas, memoria conversacional
- Objetivo: Diseñar un sistema multi-agente con arquitectura orientada a objetos
- Tecnologías: NewsAPI, WeatherAPI, ChromaDB, deduplicación con LLM
- Funcionalidades: NewsCache, DeduplicationService, AgentThoughtManager
- Objetivo: Sistema de validación y generación de datos sintéticos
- Tecnologías: Pydantic v2, validaciones personalizadas, control de LLMs
- Funcionalidades: EnhancedCustomer, AdvancedTransaction, LLMDataValidator
- Objetivo: Sistema completo de parseo JSON + extracción web con LLM tipado
- Tecnologías: SimpleWebPageReader, LLM tipado, ChromaDB, Pydantic v2
- Funcionalidades: Extracción de letras desde web, análisis de sentimientos, persistencia vectorial
- Python 3.12+
- Entorno virtual (recomendado)
- API keys para servicios externos
# OpenAI API Key (OBLIGATORIO para ejercicios con LLM)
OPENAI_API_KEY=sk-tu_api_key_de_openai
# Hugging Face Token (OBLIGATORIO para embeddings)
HF_TOKEN=hf_tu_token_aqui
# APIs opcionales para ejercicios específicos
OPENWEATHER_KEY=tu_api_key_de_openweather
NEWS_API_KEY=tu_api_key_de_newsapi
# Clonar el repositorio
git clone https://github.com/alejandromorislara/Goodjob-Llamaindex-Course
cd curso-llamaindex-pydantic
# Crear entorno virtual
python -m venv .venv
source .venv/bin/activate # Linux/Mac
.venv\Scripts\activate # Windows
# Instalar dependencias
pip install -r requirements.txt
# Configurar variables de entorno
cp .env.example .env
# Editar .env con tus API keys
- 📖 Lee la guía de configuración →
setup_instructions.md
- 🔧 Configura tu entorno con las APIs necesarias (especialmente
OPENAI_API_KEY
) - 📓 Explora los notebooks en orden secuencial:
01_uso_apis_llamaindex.ipynb
- Fundamentos de APIs02_agentes_llamaindex.ipynb
- Sistemas multi-agente03_refresco_pydantic.ipynb
- Validación avanzada04_parseo_documentos.ipynb
- Parseo con LLM
- 🏋️ Completa los ejercicios de cada bloque:
- Bloque 1: APIs y Agentes
- Bloque 2: Pydantic y Parseo Web
- ✅ Revisa las soluciones para comparar enfoques
Sector Oficios 32, 28760 Tres Cantos (Madrid)
Juntos construimos un futuro más inclusivo gracias a la tecnología y la formación especializada.
© 2025 Fundación GoodJob - Programa de Voluntariado Corporativo #IMPACT