FastAPI Code Generation with Fine-Tuned CodeLlama-7B

A production-ready fine-tuning pipeline for CodeLlama-7b-Instruct-hf specialized in FastAPI code generation. This project demonstrates techniques including QLoRA quantization, github mining,dataset curation, and adaptive evaluation systems to create a model that generates production-ready FastAPI applications.

Results & Performance

Metric	Base Model	Fine-tuned Model	Improvement
FastAPI Code Quality	75.1/100	86.6/100	+11.5 points
Code Completeness	59.9/100	75.8/100	+15.9 points

Key Improvements

Proper FastAPI imports and structure - Contextual import generation
Database integration patterns - SQLAlchemy, MongoDB support
Error handling with HTTP status codes - Professional error responses
Authentication and validation logic - JWT, OAuth2, Pydantic models
Production-ready code patterns - Router organization

Project Architecture

Fine-Tuning-Open-Source-LLM/
├── configs/
│   ├── lora_config.json          # QLoRA adapter configuration
│   ├── training_args.json        # Optimized training hyperparameters
│   └── hub_config.json          # HuggingFace Hub deployment settings
├── data/
│   ├── fastapi_miner.py          # GitHub FastAPI pattern mining
│   ├── prepare_dataset.py        # Intelligent dataset preprocessing
│   └── data/
│       └── fastapi_mined_dataset.json  # 331 real-world FastAPI patterns
├── model/
│   └── load_base_model.py        # Model loading with 4-bit quantization
├── train/
│   └── run_lora_finetune.py      # Complete training pipeline
├── evaluate/
│   ├── fastapi_evaluator.py      # FastAPI-specific code evaluation
│   └── llm_judge.py             # GPT-based code quality assessment (LLM as a Judge Method)
├── notebooks/
│   └── finetune_code_llama.ipynb     # Complete fine-tuning workflow
└── requirements.txt           # Production dependencies

Quick Start

Option 1: Use Pre-trained Model (Recommended)

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# Load the fine-tuned model
model_name = "Showmick119/codellama-7b-fastapi-finetuned-20250713"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float16,
    device_map="auto",
    load_in_4bit=True
)

# Generate FastAPI code
prompt = "[INST] Create a FastAPI POST endpoint for user registration with email validation [/INST]"
inputs = tokenizer(prompt, return_tensors="pt")

with torch.no_grad():
    outputs = model.generate(
        **inputs,
        max_new_tokens=512,
        temperature=0.1,
        do_sample=True,
        pad_token_id=tokenizer.pad_token_id
    )

response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response[len(prompt):].strip())

Option 2: Fine-tune Your Own Model

Open in Google Colab (Recommended):

Local Setup:

git clone https://github.com/Showmick119/Fine-Tuning-Open-Source-LLM.git
cd Fine-Tuning-Open-Source-LLM
pip install -r requirements.txt

Configure HuggingFace Access:

import os
os.environ['HF_TOKEN'] = 'your_hf_token_here'
os.environ['OPENAI_API_KEY'] = 'your_openai_key_here'  # For LLM as a Judge Evaluation

Run Training: Execute the Jupyter notebook cells sequentially.

Methodology

1. Dataset Curation

GitHub Mining: Automated extraction of real-world FastAPI patterns
Smart Augmentation: Context-aware code variations (1.72x dataset expansion)

2. Training Configuration

QLoRA Optimization: 4-bit quantization with LoRA adapters
Efficient Training: ~55 minutes on T4 GPU with 570 examples
Progress Monitoring: Evaluation every 10 steps with detailed metrics

3. Evaluation System

FastAPI Evaluator: Syntax, imports, endpoints, error handling, authentication, validation
GPT Judge: Code quality, best practices, completeness assessment
Adaptive Scoring: Complexity-aware evaluation criteria

Dataset & Training Details

Dataset Composition

Category	Examples	Description
Authentication	215	JWT, OAuth2, session management
Database	94	SQLAlchemy, MongoDB integration
Endpoints	74	REST API patterns, CRUD operations
Models	29	Pydantic schemas, validation
Validation	4	Input validation, error handling

Training Configuration

Base Model: codellama/CodeLlama-7b-Instruct-hf
Quantization: 4-bit with bitsandbytes
LoRA Settings: r=64, alpha=32, lora_dropout=0.1
Training: 3 epochs, 2 batch size, 1e-4 learning rate, cosine scheduler
Hardware: Single T4 GPU (15GB VRAM)

Use Cases

Enterprise Development

API Scaffolding: Generate complete FastAPI applications
Code Review: Ensure best practices and error handling
Documentation: Auto-generate OpenAPI specifications

Education & Learning

FastAPI Tutorials: Generate teaching examples
Code Completion: IDE integration for FastAPI development
Best Practices: Learn proper FastAPI patterns

Rapid Prototyping

MVP Development: Quick API prototypes
Microservices: Generate service templates
Integration Testing: Create test endpoints

Model Comparison

Feature	Base CodeLlama-7B	Fine-tuned Model
FastAPI Imports	❌ Often missing	✅ Always correct
Error Handling	❌ Basic/incomplete	✅ Comprehensive
Status Codes	❌ Rarely used	✅ Proper HTTP codes
Database Patterns	❌ Generic	✅ FastAPI-specific

Evaluation Results

Test Case Performance Against Base Model

Authentication Endpoint: +70.0 Pts on Custom FastAPI Evaluator, +78.0 Pts on LLM Judge
CRUD Operations: +20.0 Pts on Custom FastAPI Evaluator, +21.0 Pts on LLM Judge
Dependency Injection: +10.0 Pts on Custom FastAPI Evaluator, +43.5 Pts on LLM Judge
User Management: +15.0 Pts on Custom FastAPI Evaluator, +13.5 Pts on LLM Judge

Key Improvements Demonstrated

No more repetition (eliminated base model hallucinations)
Context-aware imports (only includes what's actually used)
Professional error handling (proper HTTP status codes)
Database integration (SQLAlchemy, MongoDB patterns)

Requirements

Core Dependencies

torch>=2.0.0
transformers>=4.36.0
datasets>=2.15.0
peft>=0.7.0
bitsandbytes>=0.41.0
accelerate>=0.25.0
tqdm>=4.66.0
numpy>=1.24.0
requests>=2.31.0
openai>=1.0.0     # For LLM as a Judge Evaluation 
huggingface_hub>=0.19.0
trl>=0.7.0
jupyter>=1.0.0
evaluate>=0.4.0

Hardware Requirements

Minimum: T4 GPU (15GB VRAM) for training
Recommended: A100 or V100 for faster training
Inference: CPU compatible with 4-bit quantization

Contributing

Fork the repository
Create a feature branch (git checkout -b feature/amazing-feature)
Commit your changes (git commit -m 'Add amazing feature')
Push to the branch (git push origin feature/amazing-feature)
Open a Pull Request

Acknowledgments

Meta AI for the base CodeLlama-7b-Instruct model
HuggingFace for the transformers library and model hosting
Microsoft for QLoRA implementation and training optimizations
FastAPI community for the excellent framework and patterns

Contact & Support

GitHub Issues: Report bugs or request features
Model Downloads: HuggingFace Hub

⭐ Star this repository if you find it helpful!

Built with ❤️ for the FastAPI and AI community

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

FastAPI Code Generation with Fine-Tuned CodeLlama-7B

Results & Performance

Key Improvements

Project Architecture

Quick Start

Option 1: Use Pre-trained Model (Recommended)

Option 2: Fine-tune Your Own Model

Methodology

1. Dataset Curation

2. Training Configuration

3. Evaluation System

Dataset & Training Details

Dataset Composition

Training Configuration

Use Cases

Enterprise Development

Education & Learning

Rapid Prototyping

Model Comparison

Evaluation Results

Test Case Performance Against Base Model

Key Improvements Demonstrated

Requirements

Core Dependencies

Hardware Requirements

Contributing

Acknowledgments

Contact & Support

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 153 Commits
configs		configs
data		data
evaluate		evaluate
model		model
notebooks		notebooks
train		train
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

License

Showmick119/Fine-Tuning-Open-Source-LLM

Folders and files

Latest commit

History

Repository files navigation

FastAPI Code Generation with Fine-Tuned CodeLlama-7B

Results & Performance

Key Improvements

Project Architecture

Quick Start

Option 1: Use Pre-trained Model (Recommended)

Option 2: Fine-tune Your Own Model

Methodology

1. Dataset Curation

2. Training Configuration

3. Evaluation System

Dataset & Training Details

Dataset Composition

Training Configuration

Use Cases

Enterprise Development

Education & Learning

Rapid Prototyping

Model Comparison

Evaluation Results

Test Case Performance Against Base Model

Key Improvements Demonstrated

Requirements

Core Dependencies

Hardware Requirements

Contributing

Acknowledgments

Contact & Support

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages