XGenerationLab
diff --git a/‎README.md
Lines changed: 88 additions & 0 deletions b/‎README.md
Lines changed: 88 additions & 0 deletions
diff --git a/‎pyproject.toml
Lines changed: 22 additions & 0 deletions b/‎pyproject.toml
Lines changed: 22 additions & 0 deletions
diff --git a/‎requirements.txt
Lines changed: 4 additions & 0 deletions b/‎requirements.txt
Lines changed: 4 additions & 0 deletions
diff --git a/‎src/xiyan_mcp_server/__init__.py
Lines changed: 9 additions & 0 deletions b/‎src/xiyan_mcp_server/__init__.py
Lines changed: 9 additions & 0 deletions
diff --git a/‎src/xiyan_mcp_server/config/db_config.py
Lines changed: 25 additions & 0 deletions b/‎src/xiyan_mcp_server/config/db_config.py
Lines changed: 25 additions & 0 deletions
diff --git a/‎src/xiyan_mcp_server/database_env.py
Lines changed: 9 additions & 0 deletions b/‎src/xiyan_mcp_server/database_env.py
Lines changed: 9 additions & 0 deletions
diff --git a/‎src/xiyan_mcp_server/datasource/db_mschema.py
Lines changed: 194 additions & 0 deletions b/‎src/xiyan_mcp_server/datasource/db_mschema.py
Lines changed: 194 additions & 0 deletions
@@ -0,0 +1,88 @@
+
+# XiYan MCP Server
+
+A Model Context Protocol (MCP) server that enables secure interaction with MySQL databases. This server allows AI assistants to list tables, read data, and execute SQL queries through a controlled interface, making database exploration and analysis safer and more structured.
+
+## Features
+- Fetch data by natural language throught XiYanSQL (https://github.com/XGenerationLab/XiYan-SQL)
+- List available MySQL tables as resources
+- Read table contents
+
+## Installation
+
+```bash
+pip install xiyan-mcp-server
+```
+
+## Configuration
+
+Set the following environment variables:
+
+```bash
+MYSQL_HOST=    # Database host
+MYSQL_PORT=         # Optional: Database port (defaults to 3306 if not specified)
+MYSQL_USER=
+MYSQL_PASSWORD=
+MYSQL_DATABASE=
+MODEL_NAME=       
+MODEL_KEY=  
+MODEL_URL= 
+```
+
+## Usage
+
+### With Claude Desktop
+
+Add this to your `claude_desktop_config.json`:
+
+```json
+{
+  "mcpServers": {
+    "xiyan": {
+      "command": "uv",
+      "args": [
+        "--directory", 
+        "path/to/xiyan_mcp_server",
+        "run",
+        "xiyan_mcp_server"
+      ],
+      "env": {
+        "MYSQL_HOST": "localhost",
+        "MYSQL_PORT": "3306",
+        "MYSQL_USER": "your_username",
+        "MYSQL_PASSWORD": "your_password",
+        "MYSQL_DATABASE": "your_database",
+        "MODEL_NAME": "your_model_name",
+        "MODEL_URL": "your_model enpoint",
+        "MODEL_KEY": "your_model_key"
+      }
+    }
+  }
+}
+```
+
+### As a standalone server
+
+```bash
+# Install dependencies
+pip install -r requirements.txt
+
+# Run the server
+python -m xiyan_mcp_server
+```
+
+## Development
+
+```bash
+# Clone the repository
+git clone https://github.com/yourusername/mysql_mcp_server.git
+cd xiyan_mcp_server
+
+# Create virtual environment
+python -m venv venv
+source venv/bin/activate  # or `venv\Scripts\activate` on Windows
+
+# Install development dependencies
+pip install -r requirements.txt
+
+```
@@ -0,0 +1,22 @@
+[project]
+name = "xiyan_mcp_server"
+version = "0.1.0"
+description = "A Model Context Protocol (MCP) server that using XiyanSQL with MySQL databases. This server allows AI assistants to list tables, read data, and execute natual language queries."
+readme = "README.md"
+requires-python = ">=3.11"
+dependencies = [
+    "mcp>=1.0.0",
+    "mysql-connector-python>=9.1.0",
+    "llama_index",
+    "sqlalchemy"
+]
+[[project.authors]]
+name = "Zhiling Luo"
+email = "godot.lzl@alibaba-inc.com"
+
+[build-system]
+requires = ["hatchling"]
+build-backend = "hatchling.build"
+
+[project.scripts]
+mysql_mcp_server = "xiyan_mcp_server:main"
@@ -0,0 +1,4 @@
+mcp>=1.0.0
+mysql-connector-python>=9.1.0
+sqlalchemy
+llama_index
@@ -0,0 +1,9 @@
+#from . import server
+from server import *
+
+def main():
+   """Main entry point for the package."""
+   mcp.run()
+
+# Expose important items at package level
+__all__ = ['main', 'server']
@@ -0,0 +1,25 @@
+from dataclasses import dataclass, field
+from typing import Optional
+
+from urllib.parse import quote_plus
+@dataclass
+class DBConfig:
+    dialect: str = 'sqlite'
+    db_path: Optional[str] = None  # 仅用于 SQLite
+    db_name: Optional[str] = None  # MySQL/PostgreSQL 通用
+    user_name: Optional[str] = None  # MySQL/PostgreSQL 通用
+    db_pwd: Optional[str] = None  # MySQL/PostgreSQL 通用
+    db_host: Optional[str] = None  # MySQL/PostgreSQL 通用
+    port: Optional[int] = None  # MySQL/PostgreSQL 通用
+
+    def __post_init__(self):
+        if self.dialect == 'sqlite':
+            self.db_path = self.db_path or 'book_1.sqlite'
+        elif self.dialect in ['mysql', 'postgresql']:
+            self.db_name = self.db_name or 'default_db'
+            self.user_name = self.user_name or 'default_user'
+            self.db_pwd = quote_plus(self.db_pwd) or 'default_password'
+            self.db_host = self.db_host or 'localhost'
+            self.port = self.port or (3306 if self.dialect == 'mysql' else 5432)
+        else:
+            raise ValueError(f"Unsupported database dialect: {self.dialect}")
@@ -0,0 +1,9 @@
+from datasource.db_source import HITLSQLDatabase
+
+class DataBaseEnv:
+    def __init__(self, database: HITLSQLDatabase):
+        self.database = database
+        self.dialect = database.dialect
+        self.mschema = database.mschema
+        self.db_name = database.db_name
+        self.mschema_str = self.mschema.to_mschema()
@@ -0,0 +1,194 @@
+import random
+from utils.file_util import read_json_file, write_json_to_file, save_raw_text
+from utils.db_util import examples_to_str
+from typing import Any, Dict, Iterable, List, Optional, Tuple, Union
+
+
+class MSchema:
+    def __init__(self, db_id: str = 'Anonymous', schema: Optional[str] = None):
+        self.db_id = db_id
+        self.schema = schema
+        self.tables = {}
+        self.foreign_keys = []
+
+    def add_table(self, name, fields={}, comment=None):
+        self.tables[name] = {"fields": fields.copy(), 'examples': [], 'comment': comment}
+
+    def add_field(self, table_name: str, field_name: str, field_type: str = "",
+            primary_key: bool = False, nullable: bool = True, default: Any = None,
+            autoincrement: bool = False, comment: str = "", examples: list = [], **kwargs):
+        self.tables[table_name]["fields"][field_name] = {
+            "type": field_type,
+            "primary_key": primary_key,
+            "nullable": nullable,
+            "default": default if default is None else f'{default}',
+            "autoincrement": autoincrement,
+            "comment": comment,
+            "examples": examples.copy(),
+            **kwargs}
+
+    def add_foreign_key(self, table_name, field_name, ref_schema, ref_table_name, ref_field_name):
+        self.foreign_keys.append([table_name, field_name, ref_schema, ref_table_name, ref_field_name])
+
+    def get_field_type(self, field_type, simple_mode=True)->str:
+        if not simple_mode:
+            return field_type
+        else:
+            return field_type.split("(")[0]
+
+    def has_table(self, table_name: str) -> bool:
+        if table_name in self.tables.keys():
+            return True
+        else:
+            return False
+
+    def has_column(self, table_name: str, field_name: str) -> bool:
+        if self.has_table(table_name):
+            if field_name in self.tables[table_name]["fields"].keys():
+                return True
+            else:
+                return False
+        else:
+            return False
+
+    def get_field_info(self, table_name: str, field_name: str) -> Dict:
+        try:
+            return self.tables[table_name]['fields'][field_name]
+        except:
+            return {}
+
+    def single_table_mschema(self, table_name: str, selected_columns: List = None,
+                             example_num=3, show_type_detail=False, shuffle=True) -> str:
+        table_info = self.tables.get(table_name, {})
+        output = []
+        table_comment = table_info.get('comment', '')
+        if table_comment is not None and table_comment != 'None' and len(table_comment) > 0:
+            if self.schema is not None and len(self.schema) > 0:
+                output.append(f"# Table: {self.schema}.{table_name}, {table_comment}")
+            else:
+                output.append(f"# Table: {table_name}, {table_comment}")
+        else:
+            if self.schema is not None and len(self.schema) > 0:
+                output.append(f"# Table: {self.schema}.{table_name}")
+            else:
+                output.append(f"# Table: {table_name}")
+
+        field_lines = []
+        # 处理表中的每一个字段
+        for field_name, field_info in table_info['fields'].items():
+            if selected_columns is not None and field_name.lower() not in selected_columns:
+                continue
+
+            raw_type = self.get_field_type(field_info['type'], not show_type_detail)
+            field_line = f"({field_name}:{raw_type.upper()}"
+            if field_info['comment'] != '':
+                field_line += f", {field_info['comment'].strip()}"
+            else:
+                pass
+
+            ## 打上主键标识
+            is_primary_key = field_info.get('primary_key', False)
+            if is_primary_key:
+                field_line += f", Primary Key"
+
+            # 如果有示例，添加上
+            if len(field_info.get('examples', [])) > 0 and example_num > 0:
+                examples = field_info['examples']
+                examples = [s for s in examples if s is not None]
+                examples = examples_to_str(examples)
+                if len(examples) > example_num:
+                    examples = examples[:example_num]
+
+                if raw_type in ['DATE', 'TIME', 'DATETIME', 'TIMESTAMP']:
+                    examples = [examples[0]]
+                elif len(examples) > 0 and max([len(s) for s in examples]) > 20:
+                    if max([len(s) for s in examples]) > 50:
+                        examples = []
+                    else:
+                        examples = [examples[0]]
+                else:
+                    pass
+                if len(examples) > 0:
+                    example_str = ', '.join([str(example) for example in examples])
+                    field_line += f", Examples: [{example_str}]"
+                else:
+                    pass
+            else:
+                field_line += ""
+            field_line += ")"
+
+            field_lines.append(field_line)
+
+        if shuffle:
+            random.shuffle(field_lines)
+
+        output.append('[')
+        output.append(',\n'.join(field_lines))
+        output.append(']')
+
+        return '\n'.join(output)
+
+    def to_mschema(self, selected_tables: List = None, selected_columns: List = None,
+                   example_num=3, show_type_detail=False, shuffle=True) -> str:
+        """
+        convert to a MSchema string.
+        selected_tables: 默认为None，表示选择所有的表
+        selected_columns: 默认为None，表示所有列全选，格式['table_name.column_name']
+        """
+        output = []
+
+        if selected_tables is not None:
+            selected_tables = [s.lower() for s in selected_tables]
+        if selected_columns is not None:
+            selected_columns = [s.lower() for s in selected_columns]
+            selected_tables = [s.split('.')[0].lower() for s in selected_columns]
+
+        # 依次处理每一个表
+        for table_name, table_info in self.tables.items():
+            if selected_tables is None or table_name.lower() in selected_tables:
+                cur_table_type = table_info.get('type', 'table')
+                column_names = list(table_info['fields'].keys())
+                if selected_columns is not None:
+                    cur_selected_columns = [c for c in column_names if f"{table_name}.{c}".lower() in selected_columns]
+                else:
+                    cur_selected_columns = selected_columns
+                output.append(self.single_table_mschema(table_name, cur_selected_columns, example_num, show_type_detail, shuffle))
+
+        if shuffle:
+            random.shuffle(output)
+
+        output.insert(0, f"【DB_ID】 {self.db_id}")
+        output.insert(1, f"【Schema】")
+
+        # 添加外键信息，选择table_type为view时不展示外键
+        if self.foreign_keys:
+            output.append("【Foreign keys】")
+            for fk in self.foreign_keys:
+                ref_schema = fk[2]
+                table1, column1, _, table2, column2 = fk
+                if selected_tables is None or \
+                        (table1.lower() in selected_tables and table2.lower() in selected_tables):
+                    if ref_schema == self.schema:
+                        output.append(f"{fk[0]}.{fk[1]}={fk[3]}.{fk[4]}")
+
+        return '\n'.join(output)
+
+    def dump(self):
+        schema_dict = {
+            "db_id": self.db_id,
+            "schema": self.schema,
+            "tables": self.tables,
+            "foreign_keys": self.foreign_keys
+        }
+        return schema_dict
+
+    def save(self, file_path: str):
+        schema_dict = self.dump()
+        write_json_to_file(file_path, schema_dict, is_json_line=False)
+
+    def load(self, file_path: str):
+        data = read_json_file(file_path)
+        self.db_id = data.get("db_id", "Anonymous")
+        self.schema = data.get("schema", None)
+        self.tables = data.get("tables", {})
+        self.foreign_keys = data.get("foreign_keys", [])