Skip to content

OMNILab/agent5lvl

Repository files navigation

agent5lvl

基于Dify,展示Agent在不同能力级别下,构建工作流和运行方式,帮助用户了解Agent的能力和应用场景。

AI Agent五个发展阶段

Level 1:基础工具与指令

  • 特点:最简单的 AI Agent,使用 LLM 结合工具和指令完成任务。
  • 功能:通过指令“教”Agent 如何完成任务,使用工具(如搜索工具 DuckDuckGoTools)与外部环境交互
  • 例子:一个帮助开发者用 构建 Agent,完成检索或计算(Wolfram)
  • 要点:适合初级任务,但能力有限

Level 2:知识库与存储

  • 特点:加入知识库和存储功能,让 Agent 能搜索外部信息并保存状态
  • 知识库:使用混合搜索(全文+语义搜索)+重排序(reranking),提升信息检索精准度
  • 存储:保存会话状态(如 ChatGPT 的聊天记录),让 Agent 在不同会话间保持“记忆”
  • 例子:Agent 能从 SQLite 数据库中读取知识,回答更复杂的问题
  • 要点:解决 LLM 无状态问题,提升任务连续性

Level 3:记忆与推理

  • 特点:Agent 具备记忆(记住用户信息)和推理能力(更聪明地解决问题)
  • 记忆:跨会话记住用户细节,实现个性化(如记住用户偏好)
  • 推理:通过推理工具(如 PythonTools)提高多步骤任务的成功率(从 60% 提升到更高)
  • 例子:Agent 在多次对话后记住用户需求,提供更贴切的回答
  • 要点:推理提升复杂任务表现,但会增加成本和延迟

Level 4:多Agent团队

  • 特点:多个 Agent 组成团队,分工合作解决复杂问题
  • 挑战:每个 Agent 需专注单一领域(工具少于 10 个),团队协作需推理支持,否则成功率低(目前成功率 <50%)
  • Agno 支持:提供三种模式(协调、路由、协作)管理多 Agent 团队
  • 例子:一个团队 Agent 分析股票数据,另一个提供建议
  • 要点:2025 年多 Agent 系统仍不成熟,适合研究而非生产

Level 5:Agent系统

  • 特点:构建完整的 Agent 系统,通过 API 异步处理任务并返回结果
  • 实现:需要数据库保存状态、异步任务处理(如 FastAPI 后台任务)和结果流式传输
  • 挑战:技术复杂(如使用 WebSocket),但这是未来趋势,也是商业化的重点
  • 例子:Agno 提供了 Agent API 和 UI,帮助开发者构建此类系统
  • 要点:最难但最有潜力,适合大规模应用

核心建议

  • 从简单开始:先从 Level 1 开始,逐步增加复杂性
  • AI 工程即软件工程:保持简单,系统更易管理
  • 工具推荐:使用 Dify、Agno(支持记忆、知识、推理等功能),并查看其文档和示例

About

Showcases of five-leveled agent theory on Dify.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published