Generative Engine Optimization (GEO) AI Agent

A sophisticated AI agent that performs Generative Engine Optimization for websites using LangGraph, OpenAI, and Jina's reranker API. The agent implements a proper agentic workflow that iteratively improves website content and tracks relevance score improvements based on target keywords.

🚀 Features

LangGraph Agentic Workflow: Uses LangGraph to create a structured, stateful workflow with proper error handling and conditional logic
Iterative Optimization: Uses LangChain for LLM calls within a LangGraph workflow that optimizes website content step by step
Multiple Optimization Types: Title, meta description, headings, content, internal linking, and schema markup
Score Tracking: Monitors relevance scores using Jina's reranker API
Threshold-based Improvements: Only keeps changes that meet improvement thresholds
HTML Processing: Converts HTML to LLM-readable format for accurate scoring
Backup System: Automatically backs up original content
History Tracking: Saves optimization history and results
Error Handling: Comprehensive error handling with graceful fallbacks

📁 Project Structure

final_code3/
├── config.py                           # Configuration and prompts
├── geo_agent.py                       # Original GEO AI agent (class-based)
├── langgraph_geo_agent.py             # Basic LangGraph GEO agent
├── langgraph_geo_agent_enhanced.py    # Enhanced LangGraph GEO agent with full integration
├── run_langgraph_geo.py               # Runner script for LangGraph agents
├── html_utils.py                      # HTML processing utilities
├── searcher.py                        # Website search functionality
├── webpage_reader.py                  # LLM-readable content extraction
├── reranker_api.py                    # Jina reranker API functions
├── website_similarity_analyzer.py     # Website similarity analysis
├── query_processor.py                 # Query processing pipeline
├── requirements.txt                   # Python dependencies
└── README.md                         # This file

🛠️ Installation

Install dependencies:

pip install -r requirements.txt

Set up environment variables:

export OPENAI_API_KEY="your_openai_api_key_here"

🎯 Usage

LangGraph Agent Usage (Recommended)

import asyncio
from langgraph_geo_agent_enhanced import EnhancedLangGraphGEOAgent

async def main():
    # Initialize the enhanced LangGraph agent
    agent = EnhancedLangGraphGEOAgent()
    
    # Optimize a website
    results = await agent.optimize_website(
        query="AI search engine optimization",
        target_url="https://example.com"  # Optional
    )
    
    if results["success"]:
        print(f"Initial Score: {results['initial_score']:.3f}")
        print(f"Final Score: {results['final_score']:.3f}")
        print(f"Improvement: {results['improvement']:.3f}")
        print(f"Iterations: {results['iterations']}")

# Run the agent
asyncio.run(main())

Interactive Runner

python run_langgraph_geo.py

This provides an interactive interface to run the LangGraph agent with options for:

Single optimization
Demo optimizations
Interactive mode

Basic Usage (Original Class-based Agent)

from geo_agent import GEOAgent
import os

# Initialize the agent
agent = GEOAgent(os.getenv("OPENAI_API_KEY"))

# Optimize a website
results = agent.optimize_website(
    website_url="https://www.hyperbots.com",
    target_keywords="AI agents automation",
    original_html="<html>...</html>"  # Optional: provide HTML directly
)

Advanced Usage with HTML Fetching

from geo_agent import GEOAgent
from html_utils import fetch_website_html
import os

# Initialize the agent
agent = GEOAgent(os.getenv("OPENAI_API_KEY"))

# Fetch website HTML
html = fetch_website_html("https://www.hyperbots.com")

if html:
    # Optimize the website
    results = agent.optimize_website(
        website_url="https://www.hyperbots.com",
        target_keywords="AI agents automation",
        original_html=html
    )
    
    print(f"Original Score: {results['original_score']:.4f}")
    print(f"Final Score: {results['final_score']:.4f}")
    print(f"Total Improvement: {results['total_improvement']:.2%}")

⚙️ Configuration

Optimization Steps

The agent performs these optimization steps in order:

Title Optimization (5% threshold)
Meta Description (3% threshold)
Heading Structure (4% threshold)
Content Optimization (8% threshold)
Internal Linking (2% threshold)
Schema Markup (3% threshold)

Agent Configuration

AGENT_CONFIG = {
    "llm_model": "gpt-4",
    "temperature": 0.7,
    "max_tokens": 2000,
    "improvement_threshold": 0.02,  # 2% minimum improvement
    "max_iterations": 10,
    "convergence_threshold": 0.01,  # Stop if improvement < 1%
    "backup_original": True,
    "save_optimization_history": True
}

🔄 LangGraph Optimization Process

The LangGraph agent implements a structured workflow with the following steps:

Input Validation: Validates query and API keys
Website Fetching: Retrieves target website HTML
Related Site Search: Finds and analyzes related websites for context
Content Extraction: Extracts LLM-readable content from related sites
Initial Scoring: Gets baseline relevance score
Content Analysis: Analyzes content and generates optimization recommendations
Content Optimization: Applies LLM-based optimizations using LangChain
Improvement Evaluation: Scores the optimized content
Conditional Iteration: Continues optimization if improvement threshold is met
Results Saving: Saves optimized HTML and detailed history

Workflow Graph

validate_input → fetch_target_website → search_related_sites → extract_related_content
     ↓
get_initial_score → analyze_content → optimize_content → evaluate_improvement
     ↓
[continue] ← should_continue → [finish] → save_results → END

Error Handling

The workflow includes comprehensive error handling:

Input validation errors
Network failures
API timeouts
LLM response parsing errors
Graceful fallbacks for missing APIs

📊 Output Files

The agent creates several output files:

website_backups/: Original HTML backups
optimized_content/: Optimized HTML files
geo_optimization_history.json: Detailed optimization history
llm_content/: LLM-readable content files

🎯 Example Results

🚀 GENERATIVE ENGINE OPTIMIZATION (GEO) AGENT
============================================================
Website: https://www.hyperbots.com
Target Keywords: AI agents automation

📊 Getting initial relevance score...
Initial relevance score: 0.4521

🔄 Optimizing: Optimize page title for SEO
   Attempt 1/3
   Current score: 0.4521
   New score: 0.4876
   Improvement: 7.85%
   ✅ Improvement meets threshold (5.0%)

🔄 Optimizing: Optimize meta description
   Attempt 1/3
   Current score: 0.4876
   New score: 0.5123
   Improvement: 5.07%
   ✅ Improvement meets threshold (3.0%)

✅ OPTIMIZATION COMPLETE
============================================================
Original Score: 0.4521
Final Score: 0.5123
Total Improvement: 13.31%
Iterations: 1
Optimized HTML saved to: optimized_content/optimized_https___www_hyperbots_com_20241201_143022.html

🔧 Customization

Adding New Optimization Types

Add prompt to GEO_PROMPTS in config.py
Add step configuration to OPTIMIZATION_STEPS
Implement optimization logic in apply_optimization() method

Adjusting Thresholds

Modify the threshold values in OPTIMIZATION_STEPS to make the agent more or less strict about improvements.

Changing LLM Model

Update AGENT_CONFIG["llm_model"] to use different OpenAI models.

🚨 Error Handling

The agent includes comprehensive error handling for:

API failures
HTML parsing errors
Network timeouts
Invalid responses

📈 Performance Monitoring

The agent tracks:

Relevance score improvements
Optimization attempts
Convergence metrics
Time spent on each step

🔍 Debugging

Enable detailed logging by modifying the print statements in the agent. The optimization history file contains detailed information about each step.

🤝 Contributing

Fork the repository
Create a feature branch
Make your changes
Add tests if applicable
Submit a pull request

📄 License

This project is licensed under the MIT License.

🆘 Support

For issues and questions:

Check the optimization history file for detailed logs
Verify your API keys are set correctly
Ensure all dependencies are installed
Check the HTML structure of your website

🔗 Related Components

Searcher: Finds similar websites for comparison
Webpage Reader: Extracts LLM-readable content
Reranker API: Scores content relevance
Website Similarity Analyzer: Compares your website with competitors

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.gitignore		.gitignore
CURL_SSE_GUIDE.md		CURL_SSE_GUIDE.md
POSTMAN_TESTING_GUIDE.md		POSTMAN_TESTING_GUIDE.md
README.md		README.md
README_API.md		README_API.md
README_ARCHITECTURE.md		README_ARCHITECTURE.md
README_GEO_AGENT.md		README_GEO_AGENT.md
api.py		api.py
api_architecture.py		api_architecture.py
api_architecture_simple.py		api_architecture_simple.py
api_architecture_sse.py		api_architecture_sse.py
api_sse_optimize.py		api_sse_optimize.py
api_sse_optimize_ngrok.py		api_sse_optimize_ngrok.py
config.py		config.py
deploy_with_ngrok.py		deploy_with_ngrok.py
example_usage.py		example_usage.py
extracted_content_https_www.hyperbots.com.txt		extracted_content_https_www.hyperbots.com.txt
geo_agent_enhanced copy.py		geo_agent_enhanced copy.py
geo_agent_enhanced.py		geo_agent_enhanced.py
html_utils.py		html_utils.py
new_html.html		new_html.html
notebook.ipynb		notebook.ipynb
optimized_html.html		optimized_html.html
original_html.html		original_html.html
orignal_document_1.json		orignal_document_1.json
orignal_document_2.json		orignal_document_2.json
query_processor.py		query_processor.py
requirements.txt		requirements.txt
requirements_api.txt		requirements_api.txt
requirements_architecture.txt		requirements_architecture.txt
reranker_api.py		reranker_api.py
searcher.py		searcher.py
setup_permissions.sh		setup_permissions.sh
similarity_results_AI_search_engine_httpswww.hyperbots.com.json		similarity_results_AI_search_engine_httpswww.hyperbots.com.json
simple_api_client.py		simple_api_client.py
simple_usage.py		simple_usage.py
sometthing.json		sometthing.json
start_api.py		start_api.py
start_api_improved.py		start_api_improved.py
start_architecture_api.py		start_architecture_api.py
start_simple_api.py		start_simple_api.py
start_sse_api_ngrok.py		start_sse_api_ngrok.py
test_agent.py		test_agent.py
test_api_client.py		test_api_client.py
test_api_curl.sh		test_api_curl.sh
test_architecture_client.py		test_architecture_client.py
test_enhanced_results.json		test_enhanced_results.json
test_ngrok.py		test_ngrok.py
test_ngrok_api.sh		test_ngrok_api.sh
test_optimized.html		test_optimized.html
test_original.html		test_original.html
test_single_step_results.json		test_single_step_results.json
webSiteData.html		webSiteData.html
webpage_reader.py		webpage_reader.py
website_similarity_analyzer.py		website_similarity_analyzer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Generative Engine Optimization (GEO) AI Agent

🚀 Features

📁 Project Structure

🛠️ Installation

🎯 Usage

LangGraph Agent Usage (Recommended)

Interactive Runner

Basic Usage (Original Class-based Agent)

Advanced Usage with HTML Fetching

⚙️ Configuration

Optimization Steps

Agent Configuration

🔄 LangGraph Optimization Process

Workflow Graph

Error Handling

📊 Output Files

🎯 Example Results

🔧 Customization

Adding New Optimization Types

Adjusting Thresholds

Changing LLM Model

🚨 Error Handling

📈 Performance Monitoring

🔍 Debugging

🤝 Contributing

📄 License

🆘 Support

🔗 Related Components

About

Uh oh!

Releases

Packages

Languages

damandeep-hyprbots/geo_backend

Folders and files

Latest commit

History

Repository files navigation

Generative Engine Optimization (GEO) AI Agent

🚀 Features

📁 Project Structure

🛠️ Installation

🎯 Usage

LangGraph Agent Usage (Recommended)

Interactive Runner

Basic Usage (Original Class-based Agent)

Advanced Usage with HTML Fetching

⚙️ Configuration

Optimization Steps

Agent Configuration

🔄 LangGraph Optimization Process

Workflow Graph

Error Handling

📊 Output Files

🎯 Example Results

🔧 Customization

Adding New Optimization Types

Adjusting Thresholds

Changing LLM Model

🚨 Error Handling

📈 Performance Monitoring

🔍 Debugging

🤝 Contributing

📄 License

🆘 Support

🔗 Related Components

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages