知识库管理MCP服务器 v2.0

一个专为 FastGPT 设计的知识库管理工具，基于 FastMCP 构建，提供智能的知识库搜索和管理功能。支持自适应查找知识，帮助 AI 助手更好地理解和检索相关信息。

🌟 核心特性

🎯 自适应知识查找

智能关键词扩展: 自动将核心词扩展为同义词、相关词、上下文词
多层级搜索策略: 从精确匹配到模糊搜索的渐进式查找
跨数据集并行搜索: 同时在多个知识库中查找相关信息
深度文件夹探索: 自动发现深层目录中的知识库资源

🔧 丰富的工具集

目录树浏览: 快速了解知识库结构和可用数据集
精确搜索: 在指定数据集中进行高精度内容检索
批量搜索: 跨多个数据集的并行搜索和结果汇总
完整内容查看: 获取文档的完整内容和详细信息
文件夹深度探索: 发现和访问嵌套文件夹中的资源

🚀 快速开始

1. 安装依赖

本项目使用 uv 进行依赖管理：

# 安装 uv（如果尚未安装）
curl -LsSf https://astral.sh/uv/install.sh | sh

# 安装项目依赖
uv sync

2. 配置环境

复制配置文件并根据需要修改：

cp config.env.example .env

在 .env 文件中配置您的设置：

# 知识库配置
DEFAULT_PARENT_ID=your-parent-id

# API配置
API_BASE_URL=http://your-api-domain.com
API_TOKEN=your-api-token

# MCP服务器配置
MCP_SERVER_HOST=0.0.0.0
MCP_SERVER_PORT=18007

3. 启动服务器

# 使用 uv 运行
uv run python main.py

# 或者激活虚拟环境后运行
source .venv/bin/activate  # Linux/Mac
# 或 .venv\Scripts\activate  # Windows
python main.py

服务器将在配置的端口启动（默认 http://0.0.0.0:18007），SSE端点为 http://0.0.0.0:18007/sse

🔗 FastGPT 集成配置

MCP 客户端配置

在 FastGPT 的 MCP 配置中添加以下设置：

{
  "name": "知识库管理工具",
  "url": "http://0.0.0.0:18007/sse?parentId=YOUR_PARENT_ID",
  "description": "智能知识库搜索和管理工具"
}

🔑 ParentId 配置说明

parentId 是知识库访问的关键标识符，有两种配置方式：

方式1: URL参数配置（推荐）

在 MCP 配置的 URL 中直接指定：

http://0.0.0.0:18007/sse?parentId=your-specific-parent-id

方式2: 默认配置

在 .env 文件中设置默认值：

DEFAULT_PARENT_ID=your-default-parent-id

智能切换机制:

系统会自动检测 URL 中的 parentId 参数变化
支持会话级别的 parentId 存储和管理
当 URL 参数变化时，自动更新当前会话的知识库访问权限

🛠️ 可用工具

1. 📁 get_dataset_tree

获取知识库目录树，浏览所有可用的数据集和文件夹。

# 基础用法
get_dataset_tree()

# 带过滤的用法
get_dataset_tree(search_value="网络管理 系统", deep=6)

2. 🔍 search_dataset

在指定数据集中进行精确搜索。

search_dataset(
    dataset_id="dataset-123",
    text="用户权限管理",
    limit=10
)

3. 🔍 multi_dataset_search

跨多个数据集的并行搜索。

multi_dataset_search(
    dataset_ids=["dataset-1", "dataset-2", "dataset-3"],
    query="系统配置",
    limit_per_dataset=5
)

4. 📄 view_collection_content

查看文档的完整内容。

view_collection_content(
    collection_id="collection-456",
    page_size=50
)

5. 🎯 expand_search_keywords

智能关键词扩展，提升搜索效果。

expand_search_keywords(
    original_query="用户管理",
    expansion_type="comprehensive"
)

6. 📂 explore_folder_contents

深入探索文件夹内容，发现嵌套资源。

explore_folder_contents(
    folder_id="folder-789",
    search_value="配置文档",
    deep=8
)

🧠 智能搜索策略

自适应查找流程

关键词扩展: 使用 expand_search_keywords 生成相关词汇
目录探索: 通过 get_dataset_tree 发现相关数据集
精确搜索: 使用 search_dataset 在目标数据集中搜索
批量搜索: 通过 multi_dataset_search 扩大搜索范围
深度查看: 使用 view_collection_content 获取完整信息

最佳实践

# 1. 首先扩展关键词
expanded = expand_search_keywords("用户权限", "comprehensive")

# 2. 探索相关数据集
tree = get_dataset_tree("用户 权限 管理", deep=5)

# 3. 多数据集并行搜索
results = multi_dataset_search(
    dataset_ids=["found-dataset-1", "found-dataset-2"],
    query="用户权限管理配置",
    limit_per_dataset=8
)

# 4. 查看详细内容
content = view_collection_content("relevant-collection-id")

📊 功能特点

🎯 智能化

自动关键词扩展和语义理解
渐进式搜索策略，从精确到模糊
智能结果排序和相关性评分

⚡ 高性能

并行搜索多个数据集
异步处理提升响应速度
智能缓存和会话管理

🔧 易用性

统一的API接口设计
详细的错误提示和日志
灵活的参数配置

🛡️ 可靠性

完善的异常处理机制
会话级别的状态管理
自动重试和容错处理

📝 日志和调试

服务器提供详细的日志信息，包括：

🔑 ParentId 使用和切换记录
🔍 搜索请求和结果统计
⚡ 性能监控和错误追踪
📊 工具使用情况分析

🤝 与 FastGPT 的协同

这个工具专为 FastGPT 设计，提供：

智能知识检索: 帮助 AI 快速找到相关信息
上下文理解: 通过关键词扩展提升理解能力
多源信息整合: 跨数据集搜索提供全面视角
动态知识库切换: 通过 parentId 灵活访问不同知识库

🔧 技术架构

框架: FastMCP (基于 FastAPI)
传输协议: Server-Sent Events (SSE)
异步处理: asyncio 并发处理
会话管理: 基于客户端ID的状态存储
API集成: RESTful API 客户端

📞 支持和反馈

如有问题或建议，请通过以下方式联系：

查看日志文件获取详细错误信息
检查 .env 配置文件是否正确
确认 API 连接和 parentId 设置
使用 uv run python main.py 启动服务器

让 AI 更智能地管理和检索知识！ 🚀

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
.idea		.idea
config		config
src		src
.env		.env
.gitignore		.gitignore
.python-version		.python-version
ARCHITECTURE.md		ARCHITECTURE.md
MCP_TOOLS_GUIDE.md		MCP_TOOLS_GUIDE.md
README.md		README.md
agent_prompt.md		agent_prompt.md
config.env.example		config.env.example
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock
权限配置说明.md		权限配置说明.md

kekewolf/fastgpt-dataset-mcp

Folders and files

Latest commit

History

Repository files navigation