MCP (Model Context Protocol) Dataset Fine-tuning Toolkit

A comprehensive toolkit for creating datasets, training, and evaluating fine-tuned models for the Model Context Protocol.

Overview

This toolkit provides end-to-end functionality for fine-tuning large language models on MCP-style instructions using PEFT/QLoRA methods. The system enables efficient fine-tuning on consumer hardware (e.g., RTX 3090) by leveraging parameter-efficient methods.

Features

Dataset Generation: Create supervised instruction-completion pairs for MCP tasks
Example Templating: Generate templates for various MCP servers (Filesystem, Git, GitHub, Database, etc.)
Validation Tools: Ensure dataset quality and formatting consistency
Training Integration: Fine-tune models using HuggingFace PEFT/QLoRA
Evaluation Framework: Compare fine-tuned models against baselines on MCP tasks

Architecture

The toolkit uses:

UV for Python environment management
PEFT/QLoRA for parameter-efficient fine-tuning
HuggingFace Transformers for model management
Justfile for workflow orchestration
Pytest for component testing

Getting Started

# Set up the environment with UV
just setup

# Generate MCP example templates
just generate-examples

# Generate dataset from examples
just generate-dataset

# Validate the dataset
just validate-dataset

# Run all tests
just test-all

# Run the entire pipeline
just complete-workflow

Technical Details

Dataset Format

The dataset consists of instruction-completion pairs following MCP conventions:

{
  "examples": [
    {
      "instruction": "Find commit history of main.py file from the last week",
      "completion": "I'll find the commit history...\n\n<use_mcp_tool>\n<server_name>git</server_name>...",
      "metadata": {
        "server": "git",
        "tool": "log",
        "complexity": "simple"
      }
    }
  ]
}

Fine-tuning Approach

Loss Masking: Using DataCollatorForCompletionOnlyLM to mask prompt tokens (setting to -100)
Parameter Efficiency: LoRA adapters focus training on a small subset of model parameters
Hardware Requirements: Optimized for consumer GPUs (e.g., RTX 3090)
Integration: Supports Accelerate for multi-GPU or distributed training

MCP Server Categories

The toolkit supports examples from multiple MCP servers:

Filesystem: File operations, directory management, path manipulation
Git: Repository operations, commit history, diffs, branch management
GitHub: Issues, PRs, repository exploration, code search
Database: Query execution, schema exploration
Custom Tools: Weather data, calculator functions, image processing

Contributing

See the TODO.md file for upcoming features and improvements.

License

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
data		data
src		src
.gitignore		.gitignore
README.md		README.md
TODO.md		TODO.md
evaluation-methodology.md		evaluation-methodology.md
implementation-roadmap.md		implementation-roadmap.md
justfile		justfile
justfile-updates.md		justfile-updates.md
requirements.txt		requirements.txt
training-implementation-plan.md		training-implementation-plan.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

MCP (Model Context Protocol) Dataset Fine-tuning Toolkit

Overview

Features

Architecture

Getting Started

Technical Details

Dataset Format

Fine-tuning Approach

MCP Server Categories

Contributing

License

About

Uh oh!

Releases

Packages

Uh oh!

Languages

PromptExecution/finetune-mcp-instructions

Folders and files

Latest commit

History

Repository files navigation

MCP (Model Context Protocol) Dataset Fine-tuning Toolkit

Overview

Features

Architecture

Getting Started

Technical Details

Dataset Format

Fine-tuning Approach

MCP Server Categories

Contributing

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages