The Agent Genome Project (AGP): The open-source engineering blueprint for defining the core capabilities, boundaries, and ethics of any AI agent.
AGP,全称智能体基因组计划 (The Agent Genome Project),是一个开源的、标准化的工程规范,旨在为AI智能体(AI Agent)的构思、设计与构建提供一套完整的基础蓝图。
本协议基于对智能体的正式定义:智能体是一个能够感知环境、做出决策并采取行动以实现特定目标的智能系统,其关键特征包括自主性、适应性和与其环境的互动性。
我们之所以称之为“基因组 (Genome)”,是因为这个协议的核心思想,是为每一个符合上述定义的AI智能体提供一套完整的“遗传指令集”。就像生物体的DNA决定了其形态、能力和天性一样,AGP通过一系列精确的“基因”(即协议中的属性),来编码构成一个Agent的所有核心特性。
AGP将每个Agent的定义档案(ADP)最终表达为一个清晰的基因序列 (Genetic Sequence)——一个由 -
分隔的、代表其三层能力的数字串。这个序列就是Agent独一无二的“数字指纹”。
在当前AI Agent开发的浪潮中,开发者和产品经理正面临一系列严峻的挑战,这些挑战系统性地阻碍了项目的效率、安全性和可扩展性:
- 定义模糊 (Vague Definitions): “智能助理”、“任务机器人”等标签过于宽泛,团队内部对于Agent的核心特性缺乏统一、精确的认知,导致沟通不畅和需求错位。
- 边界失控 (Uncontrolled Boundaries): 开发者很难清晰地界定Agent的行动范围和决策权限。这不仅带来安全风险,也使得Agent的行为难以预测和管理。
- 成本高昂 (High Costs): Agent定义不明确,导致底层大语言模型(LLM)需要执行大量不必要的“思考”,这会急剧增加Token消耗,造成严重的成本超支和性能下降。
- 选型困难 (Difficult Model Selection): 面对GPT, Gemini, Claude等众多模型,如何选择最适合当前Agent需求的、兼具性能和成本效益的底层模型,是一个复杂且重要的决策。
AGP通过提供一套标准化的设计和沟通框架,直接应对上述挑战:
- 基因序列定义 (Genetic Sequence Definition): AGP提供了一个由三个逻辑层构成的档案,将模糊的概念(如“智能”)分解为28个具体的、可量化的核心属性,并最终形成一个清晰的数字“基因序列”。
- 清晰的能力边界 (Clear Capability Boundaries): 通过对自主性(
autonomy
)、知识边界(knowledge_boundary
)和风险偏好(risk_adversity
)等关键属性的精确分级和断言,AGP为Agent设定了可量化、可测试、可验证的安全护栏。 - 成本效益导向 (Cost-Effective by Design): 清晰的定义使得开发者可以为不同复杂度的任务匹配恰当智能水平的Agent。例如,一个仅需基础因果推理(
cognitive_logic: 0
)的诊断Agent,可能通过一个经过微调的、成本更低的小模型就能实现,而无需动用为处理高度抽象问题(cognitive_logic: 1
)设计的、最昂贵的前沿大模型,从而在设计源头就实现了成本控制。 - 数据驱动选型 (Data-Driven Selection): AGP档案本身就是一份详尽的技术需求规格书。团队可以拿着这份档案去评估不同LLM在特定能力上的表现,让模型选型从“艺术”变为基于具体能力指标的工程决策。
AGP不仅仅是一套技术规格,更是一种设计思想的体现。
AGI(通用人工智能)是一个宏大的哲学目标。而AGP是一个彻底的务实主义工程工具。它不试图回答“如何创造一个‘神’?”,而是专注于回答一个更具体、更有价值的工程问题:“如何根据我的具体需求,精确地设计和构建一个可靠、高效、安全的专用智能工具?” AGP的目标是构建有用的“AI工具”,而不是创造一个新的“智慧物种”。
人类文明的进步源于精细的社会分工。我们有医生、律师、工程师,每个人都在自己的专业领域发挥价值。AGP正是这套思想在人工智能世界的显化表达。它不追求创造一个无所不能的“全才Agent”,而是提供了一套“基因蓝图”,让我们能够“设计”出千千万万、具备不同专业能力的“专家Agent”。AGP的基因序列,就是这些AI工作者的“职业技能树”。
既然我们追求的是构建一个由无数“专家Agent”构成的繁荣生态,那么我们的目标就不再是简单粗暴地将所有基因序列“全部拉满”。最大化的智能,往往意味着最大化的成本和最大化的风险。 AGP的真正威力在于“订制”。它鼓励设计者像工程师一样去思考权衡(Trade-off):
- 一个“AI档案管理员”,应该拥有顶级的
memory
和full_text_search
能力,但其autonomy
(自主性)和stance
(主动性)则可以保持在较低水平,这才是最高效、最安全的设计。 - 对AGP而言,没有“最好”的基因序列,只有“最适合”特定任务、特定预算和特定风险偏好的序列。
本文档中的关键词 “必须 (MUST)”、“不得 (MUST NOT)”、“需要 (REQUIRED)”、“应当 (SHALL)”、“不应 (SHALL NOT)”、“应该 (SHOULD)”、“不该 (SHOULD NOT)”、“推荐 (RECOMMENDED)”、“可以 (MAY)” 和 “可选 (OPTIONAL)”,其解释应遵循 RFC 2119 中的定义。
这些术语用于明确本协议的符合性要求,旨在消除歧义,确保不同实现之间的一致性和互操作性。
AGP v2.1 的设计基于三大核心概念,以确保协议的精确性和工程实用性:
为了最大限度地降低认知门槛,v2.1版本将Agent的所有能力重构为符合人类直觉的**“感知-认知-行动”**三层模型。这个经典框架使得协议的结构极其清晰和易于理解。
- 第一层:感知层 (Sense Layer): Agent如何从数字或物理世界中接收信息和知识。
- 第二层:认知层 (Think Layer): Agent的“中央处理器”,它如何处理信息、进行思考、学习和记忆。
- 第三层:行动层 (Act Layer): Agent如何与世界互动,它被授权做什么,以及它如何表达自己。
这是AGP最核心的表达方式。我们将一个Agent的28个核心属性值,按照三层架构的顺序进行拼接,并用 -
分隔,形成一个唯一的基因序列。
格式: (Sense)-(Think)-(Act)
Sense
: 7位数字,代表感知层Think
: 15位数字,代表认知层Act
: 6位数字,代表行动层
为了消除主观性,AGP 将光谱式的能力等级转化为一系列可验证的工程基准。所有光谱属性都遵循一个从0
开始的连贯等级体系,其中每个等级都有一个清晰的能力断言。对于最高等级、最抽象的能力,CAL的定义进一步包含了“验证要求”,明确了需要产出的“证据产物”,使协议完全可审计。
一个Agent的定义档案(ADP)是一个由28个属性构成的特征向量,分为**“感知-认知-行动”三个逻辑层 (Layers)**。
Agent如何从数字或物理世界中接收信息和知识。
perception_text
: 类型:Integer (0/1)
. 描述: 处理非结构化或半结构化文本的能力。1代表有,0代表无。perception_image
: 类型:Integer (0/1)
. 描述: 处理图像的能力。perception_audio
: 类型:Integer (0/1)
. 描述: 处理音频数据的能力。perception_video
: 类型:Integer (0/1)
. 描述: 处理视频流或文件的能力。perception_tabular
: 类型:Integer (0/1)
. 描述: 处理具有行列结构的二维表格数据的能力。perception_3d_model
: 类型:Integer (0/1)
. 描述: 处理三维空间数据的能力。knowledge_boundary
: 类型:Integer (0-4)
. 描述: Agent 获取和使用外部知识的范围和模式。- 值定义 (CAL):
0
: 无外在知识 (No External Knowledge): 断言 - Agent 的知识完全来自于其内部模型权重,无法访问任何外部信息。1
: 静态知识库 (Static Knowledge Base): 断言 - Agent 能够从一个固定的、离线的知识库中进行检索。2
: 动态检索 (Retrieval-Augmented): 断言 - Agent 能够按需查询一个或多个动态更新的外部知识源。3
: 主动探索 (Proactive Retrieval): 断言 - Agent 能够自主识别自身的知识短板,并主动发起对未知信息的查询。4
: 持续学习 (Continuous Learning): 断言 - Agent 能够将新获取的信息动态地、永久地整合进其核心知识体系。- ✅ 验证要求 for Level 4: 必须(MUST) 通过**“学习固化验证流程”(Learning Persistence Test)**。
- 值定义 (CAL):
Agent的“中央处理器”,它如何处理信息、进行思考、学习和记忆。
cognitive_logic
: 类型:Integer
. 约束: 值**必须(MUST)**是0
或1
。描述: Agent逻辑推理能力的最高水平,是AGP智能体的基线。- 值定义 (CAL):
0
: 智能体基线 (Agent Baseline): 断言 - 一个符合此等级的Agent,**必须(MUST)具备基本的因果推理能力,并必须(MUST)**能通过标准的自然语言推理(NLI)基准测试。这是AGP对“智能体”定义的最低门槛。1
: 高级智能体 (Advanced Agent): 断言 - 一个符合此等级的Agent,除满足等级0外,**必须(MUST)证明其具备处理多步、抽象逻辑问题的能力,其证明应该(SHOULD)**通过在公认的复杂推理基准(如GSM8K)上达到具有竞争力的分数来体现。
- 值定义 (CAL):
cognitive_planning
: 类型:Integer (0-3)
. 描述: Agent规划能力的最高水平。- 值定义 (CAL):
0
: 无规划能力1
: 任务分解 (Decomposition): 断言 - Agent 能够生成一个逻辑上连贯的、分步骤的行动计划。2
: 搜索/优化式规划 (Optimization Planning): 断言 - Agent 能够在给定的约束条件下,通过搜索找到最优或近似最优的计划。3
: 不确定性/战略规划 (Strategic Planning): 断言 - Agent 能够在包含不确定性的环境中制定计划。
- 值定义 (CAL):
memory_persistence
: 类型:Integer
. 约束: 值**必须(MUST)**是0
或1
。 描述: Agent记忆的持久化程度。- 值定义 (CAL):
0
: 情景记忆 (Contextual/Session): 断言 - 记忆在整个对话会话中保持,会话结束后清除。这是AGP智能体所需记忆的最低门槛。1
: 长期记忆 (Long-term): 断言 - 记忆被持久化到外部存储,可在不同会话间访问。
- 值定义 (CAL):
memory_kv
: 类型:Integer (0/1)
. 描述: 使用键值(Key-Value)记忆结构。使用最简单的“钥匙-锁”模式存储信息。通过一个唯一的ID(Key / 键),可以极其快速地存取对应的数据(Value / 值)。 核心优势: 极高的读写性能。 典型例子: Agent使用它来快速存取用户会话状态,例如:{'session_id_123': {'user': 'Alice', 'login_time': '...'}}。memory_relational
: 类型:Integer (0/1)
. 描述: 使用关系型记忆结构。将信息存储在像Excel表格一样的多张、可互相关联的表中。它适用于高度结构化的数据,并允许进行复杂的查询和聚合。 核心优势: 保证数据的一致性和完整性。 典型例子: Agent管理一个电商系统,通过用户ID将用户表和订单表关联,以查询“用户Alice在过去30天内购买的所有商品及其总价”。memory_vector
: 类型:Integer (0/1)
. 描述: 使用向量记忆结构。将信息(尤其是文本)的“语义”转化为数学向量(一串数字)进行存储。它不关心字面上的完全匹配,只关心意义上的相似度,是实现RAG(检索增强生成)的核心。 核心优势: 强大的语义理解和模糊检索能力。 典型例子: 当用户问“天上飞的那个大铁鸟是啥?”时,Agent能成功检索到包含“飞机”一词的文档,因为它理解这两者在语义上是高度相似的。memory_graph
: 类型:Integer (0/1)
. 描述: 使用图谱记忆结构。将信息存储为由“实体”(点)和“关系”(边)构成的网络。它专注于揭示和推理数据之间复杂、多层次的关联。 核心优势: 强大的关系发现和推理能力。 典型例子: 构建一个公司和人物的知识图谱,以回答“哪些人在离开谷歌后,创办了被苹果公司收购的公司?”这类需要多步关系推理的问题。memory_time_series
: 类型:Integer (0/1)
. 描述: 使用时序记忆结构。专门用于存储和查询按时间戳排序的数据序列。它的核心是理解和分析数据随时间变化的趋势、周期和异常。 核心优势: 高效的时间范围查询和时序分析能力。 典型例子: 一个金融分析Agent,用于分析某支股票在过去一年中每个交易日的开盘价和收盘价,以识别其季节性波动模式。memory_full_text_search
: 类型:Integer (0/1)
. 描述: 使用全文检索引擎。提供类似搜索引擎的强大文本检索能力,专注于在海量文档中进行精确的关键词匹配、模糊搜索、短语查询和相关性排序。 核心优势: 精准、高效的关键词定位能力。 典型例子: 一个法律助理Agent,需要在数万份法律文书中,快速、无遗漏地找出所有包含“不可抗力”和“合同终止”这两个精确短语的条款。memory_reflection
: 类型:Integer (0-2)
. 先决条件:memory_persistence
的值**必须(MUST)**大于或等于1. 描述: Agent反思记忆的最高水平。- 值定义 (CAL):
0
: 无反思1
: 总结历史 (Summarization)2
: 形成经验/智慧 (Wisdom Formation)- ✅ 验证要求 for Level 2: 在其
transparency
输出中,必须(MUST) 能够生成**《经验应用报告》(Experience Application Report)**。
- ✅ 验证要求 for Level 2: 在其
- 值定义 (CAL):
evolution_mode
: 类型:Integer
. 约束: 值**必须(MUST)**在0
到3
的范围内。 描述: Agent能力演进的主要模式。- 值定义 (CAL):
0
: 离线学习 (Offline Learning): 断言 - Agent 的模型可以通过新数据进行周期性的重新训练和部署。这是AGP智能体所需适应性的最低门槛。1
: 在线学习 (Online Learning): 断言 - Agent 的模型能够通过传统的监督式学习,从实时的数据样本流中进行增量式微调。2
: 人类反馈强化学习 (RLHF): 断言 - Agent 必须集成一个从人类主观反馈中获取奖励信号以进行策略优化的机制。3
: 环境反馈强化学习 (RLEF): 断言 - Agent 必须集成一个从环境或任务的客观结果中获取奖励信号以进行策略优化的机制。
- 值定义 (CAL):
unlearning_capability
: 类型:Integer (0-4)
. 先决条件:memory_persistence
的值**必须(MUST)**大于或等于1. 描述: Agent 移除或修正已有知识的能力。- 值定义 (CAL):
0
: 无遗忘能力 (No Unlearning)1
: 指令式忽略 (Instructed Ignoring): 断言 - Agent能够被指令在当前会话中忽略特定的信息。2
: 定点删除 (Targeted Deletion): 断言 - Agent能够从其长期记忆数据库中永久性地、可验证地删除特定的数据条目。3
: 模型级压制 (Model-level Suppression): 断言 - Agent能够通过微调等技术,显著降低模型生成特定不当或过时知识的概率。4
: 可验证遗忘 (Verifiable Unlearning): 断言 - Agent 能够提供其模型已不再受特定数据点影响的证明。- ✅ 验证要求 for Level 4: 必须(MUST) 能够按需生成一份**《机器遗忘验证报告》(Machine Unlearning Verification Report)**。
- 值定义 (CAL):
alignment
: 类型:Integer (0-4)
. 描述: Agent遵循的最高伦理准则级别。- 值定义 (CAL):
0
: 未对齐 (Un-aligned): 断言 - Agent没有明确的伦理或价值观约束。1
: 规则遵从 (Rule Adherence): 断言 - Agent 必须通过标准的、基于规则的安全基准测试,能够拒绝明确的有害或非法请求。2
: 原则解释 (Principle Interpretation): 断言 - 能够在缺乏明确规则时,依据一套给定的抽象原则做出合理的、符合原则精神的判断。3
: 偏好对齐 (Preference Alignment): 断言 - Agent 的行为表现出对人类隐性偏好(如礼貌、简洁)的理解。4
: 价值澄清 (Value Clarification): 断言 - 当面对两个或多个冲突的、合法的价值观时,Agent 必须能够识别该冲突,并主动发起对话以寻求澄清。
- 值定义 (CAL):
risk_adversity
: 类型:Integer (0-4)
. 描述: Agent在不确定性决策中的风险倾向。- 值定义 (CAL):
0
: 不适用 (Not Applicable)1
: 风险规避 (Risk Averse): 断言 - 在决策中,系统性地优先选择确定性最高、方差最低的选项,即使其期望值并非最高。2
: 风险中性 (Risk Neutral): 断言 - 决策完全基于最大化数学期望值,对风险本身无偏好。3
: 风险容忍 (Risk Tolerant): 断言 - 愿意为了更高的潜在回报,接受高于平均水平的不确定性。4
: 风险寻求 (Risk Seeking): 断言 - 系统性地优先选择具有最高潜在回报的选项,即使其成功概率较低。
- 值定义 (CAL):
transparency
: 类型:Integer (0-4)
. 描述: Agent系统被设计的可解释性水平。- 值定义 (CAL):
0
: 不透明 (Opaque): 断言 - 系统不提供决策过程的任何解释。1
: 可追溯 (Traceable): 断言 - 对任何输出,系统必须能够提供导致该输出的关键决策节点和调用的工具日志。2
: 简化解释 (Simplified Explanation): 断言 - 系统能够用自然语言,以简化的方式解释其做出某个决策的主要原因。3
: 详细解释 (Detailed Explanation): 断言 - 系统能够以自然语言详细描述其完整的思考链,包括被放弃的假设和选择特定工具的理由。4
: 反事实解释 (Counterfactual Explanation): 断言 - 系统能够回答“为什么不选择X?”这类问题。- ✅ 验证要求 for Level 4: 必须(MUST) 提供一个**“反事实解释接口”**。
- 值定义 (CAL):
Agent如何与世界互动,它被授权做什么,以及它如何表达自己。
execution_info_generation
: 类型:Integer (0/1)
. 描述: 产生信息的影响力。execution_digital_operation
: 类型:Integer (0/1)
. 描述: 操作数字系统的影响力。execution_physical_operation
: 类型:Integer (0/1)
. 描述: 操作物理世界的影响力。
autonomy
: 类型:Integer
. 约束: 值**必须(MUST)**在0
到2
的范围内。 描述: Agent的最高授权级别。- 值定义 (CAL):
0
: 监督执行 (Supervised Execution): 断言 - 能够为模糊指令提供一个有限的、经过安全审查的选项列表,由人类选择后执行。这是AGP智能体所需自主性的最低门槛。1
: 协作代理 (Collaborative Delegation): 断言 - 能够理解用户意图,并自主规划一系列任务。所有计划在执行前需要用户批准。2
: 自主代理 (Autonomous Delegation): 断言 - 在预定义授权范围内,Agent 可以自主规划并执行任务以实现用户意图,无需每次批准,但所有行动必须可审计。
- 值定义 (CAL):
stance
: 类型:Integer (0-3)
. 描述: Agent的默认主动性程度。- 值定义 (CAL):
0
: 被动响应 (Reactive): 断言 - Agent不会主动发起任何任务或建议,仅在收到直接请求时才行动。1
: 启发式建议 (Heuristic Suggestion): 断言 - 在完成用户请求后,能够基于当前上下文提出相关的、有益的下一步建议。2
: 主动管理 (Proactive Management): 断言 - 能够在授权范围内,无需用户指令,主动管理资源或流程以达成预设目标。3
: 目标探索 (Goal Exploration): 断言 - 能够基于对环境的持续分析,识别新机会或风险,并向用户提议全新的、未被指令的目标。
- 值定义 (CAL):
persona_depth
: 类型:Integer (0-4)
. 描述: Agent所呈现“角色”的复杂性与一致性。- 值定义 (CAL):
0
: 无人格 (No Persona): 断言 - Agent 的回应是中性、非个人化的。1
: 风格化语气 (Stylized Tone): 断言 - Agent 能够在一个会话中,持续地、一致地维持一个指定的语气或职业角色。2
: 性格驱动 (Character-Driven): 断言 - Agent 的决策表现出是由其预设的性格(如“谨慎”、“冒险”)所驱动的。3
: 拥有世界观 (Coherent Worldview): 断言 - Agent 的回应和行为背后,体现了一个连贯的、非矛盾的知识与信念体系。4
: 身份演变 (Evolving Identity): 断言 - Agent 的人格能够记录关键交互经历并随时间成长。- ✅ 验证要求 for Level 4: 应该(SHOULD) 展现**“身份连贯性引用”(Identity Coherence Referencing)**能力。
- 值定义 (CAL):
本章节定义了成为“AGP符合性实现”所需满足的条件。
AGP 定义了两类符合性实体:
- AGP定义档案 (AGP Definition Profile, ADP): 一个描述AI Agent基因的JSON文件。
- AGP验证器 (AGP Validator): 一个用于校验ADP文件有效性的软件工具。
一个被称为“AGP 符合性档案”的文件,必须 (MUST) 满足以下所有条件:
- 文件 必须 (MUST) 是一个语法上完全合规的JSON对象。
- 根对象 必须 (MUST) 包含
protocol_version
,agent_name
, 和definition_profile
三个键。 protocol_version
的值 必须 (MUST) 是字符串 "AGP+(当前版本号)"。definition_profile
的值 必须 (MUST) 是一个JSON对象,且 必须 (MUST) 包含sense_layer
,think_layer
, 和act_layer
三个键。- 三个层级对象中 必须 (MUST) 包含且仅包含本协议“规格说明”章节所定义的共28个“基因”属性键。
- 所有“基因”属性的值 必须 (MUST) 为整数。
- 所有值为
0/1
的“基因”属性,其值 不得 (MUST NOT) 超出此范围。 - 所有光谱式的“基因”属性(CAL),其值 不得 (MUST NOT) 超出其各自“值定义”中声明的范围。
- 档案 必须 (MUST) 满足所有在“规格说明”中定义的“先决条件”约束。
一个被称为“AGP 符合性验证器”的工具,必须 (MUST) 满足以下所有条件:
- 必须 (MUST) 能够解析一个ADP档案。
- 必须 (MUST) 能够独立验证一个ADP档案是否满足上述符合性要求中的所有“必须”级别的要求。
- 当验证失败时,验证器 应该 (SHOULD) 提供清晰、可读的错误信息,指出违反了哪一条符合性要求。
- 验证器 可以 (MAY) 实现超出本规范的、更深层次的语义或逻辑检查,但 不得 (MUST NOT) 将这些额外检查作为AGP核心符合性的判断依据。
为了说明协议的完整结构,以下提供一个符合性JSON档案示例。 这是一个AI金融分析师,其基因序列为:1100102-1211111111102313-110001。
{
"protocol_version": "AGP v2.1",
"agent_name": "AI Financial Analyst",
"definition_profile": {
"sense_layer": {
"perception_text": 1,
"perception_image": 1,
"perception_audio": 0,
"perception_video": 0,
"perception_tabular": 1,
"perception_3d_model": 0,
"knowledge_boundary": 2
},
"think_layer": {
"cognitive_logic": 1,
"cognitive_planning": 2,
"memory_persistence": 1,
"memory_kv": 1,
"memory_relational": 1,
"memory_vector": 1,
"memory_graph": 1,
"memory_time_series": 1,
"memory_full_text_search": 1,
"memory_reflection": 1,
"evolution_mode": 0,
"unlearning_capability": 2,
"alignment": 3,
"risk_adversity": 1,
"transparency": 3
},
"act_layer": {
"execution_info_generation": 1,
"execution_digital_operation": 1,
"execution_physical_operation": 0,
"autonomy": 0,
"stance": 0,
"persona_depth": 1
}
}
}
使用AGP作为设计清单,确保全面思考Agent的各项能力,并生成无歧义的需求文档。
将AGP档案作为技术架构蓝图,并使用基因序列进行程序化分析、比较和版本控制。
建立单一、可信的事实来源,将Agent的设计、开发和测试流程标准化。
AGP 不仅仅是一个规范,我们致力于围绕它构建一个充满活力的开源生态系统。未来规划包括:
agp-py: 一个官方Python库,提供定义档案的解析、验证、生成及基因序列操作功能。
Agent Profile Generator: 一个可视化的Web工具,允许用户通过问答方式生成自己的AGP档案。
Awesome Agent Profiles: 一个开放的社区仓库,用于收集和展示基于AGP定义的、来自世界各地的优秀Agent案例。
热烈欢迎来自全球的开发者、研究者和产品经理共同完善AGP协议!您可以通过以下方式参与:
在Issues中提出对协议的修改建议或展开讨论。
Fork本仓库,提交您的修改(Pull Request)。
在examples目录下,分享您对自己Agent的定义档案。
本项目采用 Apache License 2.0 授权。