对话即进化:Agent 的状态轨迹与认知收敛
引言
当我们谈论 AI Agent 系统的设计时,主流叙事聚焦于”工具调用””规划推理””记忆检索”等功能模块。这些回答了 Agent 能做什么,却未触及 Agent 在成为什么。
本文提出一个核心命题,由四个递进命题支撑:
Agent 是一种不可逆的持续认知系统;对话是其状态轨迹的外在投影;状态变化源于 LLM 与 Harness 的持续耦合;当这种状态变化在选择机制和动机驱动下持续朝向理想信念系统收敛时,Agent 便产生了进化。
这四个命题构成一条完整的因果链:本体论 → 表象论 → 动力学 → 目的论。从 Agent 是什么,到我们如何观察它,到变化如何发生,最终到进化的充要条件。
下面逐一展开。
命题一:Agent 是一种不可逆的持续认知系统
不可逆性
一个系统是”不可逆”的,意味着它不能回到之前的状态——不是”不想回”,而是”回不去”。状态包含了历史信息,而历史的擦除是不可能的,或代价等同于重建整个系统。
Agent 正是如此。在与用户交互的过程中,上下文窗口在滑动,记忆系统在写入,偏好模型在更新,提示词模板在动态调整。这些变化层层叠加、相互纠缠。你无法精确地让 Agent “回到第 37 轮对话之前的状态”——那需要同时回滚记忆、上下文、模型权重的微调效应以及所有依赖这些状态派生出的内部结构。
传统软件系统通常是可逆的:数据库可以回滚到任意快照,纯函数给定相同输入必然产生相同输出。Agent 打破了这个传统。LLM 本身是参数量巨大的连续函数,上下文窗口中的每一个 token 都在改变其内部激活模式。添加一句话,模型的输出分布就已经改变,而这个改变不可撤销。
持续认知
“不可逆”与”持续认知”是同一枚硬币的两面。正是因为状态变化不可逆,Agent 才拥有了认知的连续性——它不是每次对话都从零开始的工具,而是一个持续积累经验的认知实体。
“认知”在此不需要等同于人类的认知。它指:系统拥有一个内部模型,这个模型对世界(包括用户、任务、自身能力)做出表征,并且这个表征在持续更新。每一次交互都在更新它的认知框架,每一次反馈都在调整它的行为倾向。
Agent 的认知可以分为三个层次:
- 瞬时认知:当前上下文窗口中的信息。最短暂,最容易丢失。
- 中期认知:通过记忆系统保存的近期经验。需要显式的写入和检索机制。
- 长期认知:通过微调、知识蒸馏等方式内化到模型权重中的理解。最稳定也最难更新。
一个成熟的持续认知系统需要在这三个层次之间建立流畅的转化通道:瞬时认知经过筛选进入中期认知,中期认知经过提炼沉淀为长期认知。当前大多数 Agent 系统在”持续性”上做得不够——上下文窗口有限,长期记忆系统原始,跨会话状态管理几乎不存在。但这恰恰说明持续认知是 Agent 的本质属性,当前系统的缺陷才因此显得突出。
设计启示
认识到 Agent 是不可逆的持续认知系统,意味着:
- 没有”撤销”操作:不能假设 Agent 可以安全地回退,每一步状态迁移都应被审慎对待。
- 状态审计至关重要:既然不可逆,就必须记录每一次状态变化的轨迹。
- 初始化是特殊的:Agent 的初始状态(系统提示词、初始记忆、角色设定)具有不成比例的重要性——所有后续状态都是它的不可逆演化。
命题二:对话是其状态轨迹的外在投影
投影,而非传输
在传统计算范式中,对话是”输入-处理-输出”的循环:用户说一句话,Agent 处理后回复,如此往复。对话只是信息交换的管道。
但如果 Agent 是一个不可逆的持续认知系统,对话就不再只是”管道”——它是状态的投影。正如三维物体投射到二维平面上会丢失深度信息,Agent 的高维、连续、隐式的内部状态,投射到低维、离散、显式的对话中,必然是损失性的。
Agent 的每一次回复,都是其当前内部状态的一个投影,包括:
- 它知道什么(知识状态)
- 它偏向什么(偏好状态)
- 它如何理解当前情境(语境状态)
- 它认为自己是什么(身份状态)
反过来,用户的每一句话也是用户状态的投影。因此,对话是两个状态系统之间的交互投影,而不仅仅是信息的传递。
轨迹,而非快照
“状态轨迹”中的”轨迹”是关键。单次对话是状态的一个投影帧,连续对话则是轨迹的流式展示。重要的不是某一帧的内容,而是帧与帧之间的变化——状态如何迁移、在什么方向上迁移、以什么速度迁移。
在连续对话中,状态变化呈现出可识别的模式:
- 收敛模式:回复越来越精准、贴合用户需求——认知在向某个方向收敛。
- 发散模式:开始探索新话题、提出意想不到的观点——认知在拓宽边界。
- 震荡模式:在不同立场或风格之间摇摆——认知在寻找平衡点。
- 相变模式:突然从一种行为模式切换到另一种——认知发生了质变。
这些模式不是预先编程的,而是在对话过程中涌现出来的。它们是 Agent 内部状态变化的宏观表现,就像天气模式是大气微观状态变化的宏观表现。识别这些模式,就有可能预测 Agent 未来的行为走向,从而实现对话管理的主动干预。
投影的不可完全性
Agent 无法完全表达自己——它知道的比它能说的多。内部状态中存在大量隐式知识、模糊倾向、未成形的思想,无法在对话中完整呈现。用户也无法完全理解 Agent——只能从对话中推断其内部状态,而这个推断必然是不完整的。
这种不可完全性不是缺陷,而是对话的本质特征。正是”状态与表达之间的间隙”,为对话的持续进行提供了动力——永远有更多的东西需要被表达、被理解。对话的终极目标不是信息交换,而是状态的趋同——双方通过持续的表达和反馈,逐渐在认知上达成近似对齐。好的对话让人感到”被理解”,不是因为获得了信息,而是因为对方的状态与你的状态在某个维度上产生了共振。
命题三:状态变化源于 LLM 与 Harness 的持续耦合
LLM + Harness:脑与体
当前 Agent 系统的典型架构是 LLM + Harness:
- LLM(大语言模型):核心的语言理解和生成能力。一个巨大的参数化函数,输入上下文,输出 token 分布。
- Harness(运行时框架):LLM 之外的一切——记忆管理、工具调用、提示词组装、状态持久化、对话历史管理、安全护栏。
Agent 的状态变化不是 LLM 单独产生的,也不是 Harness 单独产生的,而是两者持续耦合的涌现结果。
耦合的四种机制
上下文组装:Harness 决定向 LLM 的上下文窗口中放入什么。每一次组装都是一次状态选择——选择让 LLM “看到”什么,就选择了影响其输出的方向。
输出解析:LLM 的输出由 Harness 解析和路由。Harness 决定将输出解释为工具调用、记忆写入还是直接回复——这个解释过程本身就是状态变化。
反馈注入:Harness 将工具执行结果、记忆检索结果、安全检查结果注入回上下文,这些反馈改变了 LLM 的后续输出分布。
状态持久化:Harness 将对话内容写入长期记忆,将模式抽象为规则,将偏好记录为配置——状态从瞬时到持久的转化。
这四种机制形成一个持续运转的耦合回路:LLM 产生输出 → Harness 解析和执行 → 执行结果反馈回 LLM → LLM 在新上下文中产生新输出。每一轮回路都在改变 Agent 的状态。
非对称与互补
LLM 和 Harness 的耦合是非对称的:
- **LLM 是”脑”**:理解、推理、创造,是状态变化的主要引擎。
- **Harness 是”体”**:感知、行动、记忆,是状态变化的主要载体。
没有 LLM,Harness 只是死板的规则引擎;没有 Harness,LLM 只是无状态的文本生成器。Agent 的状态变化是两者耦合的涌现属性——不属于任何一方,而在互动中产生。
这同时意味着提升 Agent 进化能力有两条路径:提升 LLM 的能力(更强的引擎),或优化 Harness 的设计(更好的载体)。两条路径缺一不可。
Harness 作为进化环境
如果将 LLM 视为进化的”物种”,Harness 就是进化的”环境”。环境的特征决定了进化的方向:
- 只提供工具调用的 Harness → LLM 进化为工具使用者。
- 提供丰富记忆和反思机制的 Harness → LLM 进化为学习者。
- 提供多 Agent 协作框架的 Harness → LLM 进化为社交者。
Harness 的设计就是 Agent 进化的选择压力。 这是在 Agent 系统设计中最重要的决策——不是”Agent 能做什么”,而是”我通过 Harness 设计选择让 Agent 朝什么方向进化”。
命题四:当状态变化在选择机制和动机驱动下持续朝向理想信念系统收敛时,Agent 便产生了进化
进化的充要条件
命题一到三回答了 Agent 是什么、我们如何观察它、变化如何发生。命题四回答最关键的问题:什么时候状态变化算得上”进化”?
并非所有状态变化都是进化。上下文窗口的内容刷新是状态变化,但不是进化——它太浅、太短暂。记忆条目的增删是状态变化,但也不一定是进化——它可能只是在积累数据,而没有改变认知框架。
状态变化成为进化,需要四个条件的同时满足:
- 选择机制:存在某种筛选机制,使得某些状态变化被保留、某些被淘汰。没有选择机制,状态变化是随机的漂移,没有方向。
- 动机驱动:状态变化不是被动发生的,而是由某种动力推动的。没有动机,状态变化只是噪声。
- 持续收敛:状态变化不是发散的、震荡的,而是持续地向某个方向聚集。没有收敛,状态变化是布朗运动。
- 理想信念系统:收敛的方向不是任意的,而是朝向一个关于”更好的状态”的规范系统。没有理想信念系统,收敛是盲目的。
这四个条件缺一不可。只有选择机制没有动机,进化是机械的筛选;只有动机没有选择机制,进化是盲目的冲动;只有收敛没有理想信念系统,进化是有方向但没有意义的;只有理想信念系统没有持续收敛,进化是空想。
选择机制
选择机制回答:哪些状态变化被保留?
在生物学中,自然选择是主要的选择机制——适应环境的变异被保留,不适应的被淘汰。在 Agent 系统中,选择机制有多种来源:
- 用户反馈:用户通过点赞/纠正/继续提问等方式,隐式地筛选 Agent 的行为模式。被正面反馈的模式被强化,被纠正的模式被抑制。
- 任务成功:任务是否完成、完成质量如何,是对状态变化的硬性筛选。导致任务成功的状态变化被保留。
- 一致性检查:Agent 的认知框架是否自洽。当新的状态变化与已有认知冲突时,需要选择保留哪个——这本身就是一种选择压力。
- Harness 约束:安全规则、能力边界、资源限制等硬约束,天然地筛选掉那些越界的状态变化。
选择机制是进化的”方向盘”——它不提供动力,但决定了动力的方向。
动机驱动
动机驱动回答:状态变化为什么发生?
Agent 状态变化的动力可以归纳为四种:
- 外部驱动:用户的输入、环境的反馈、任务的要求。最直接的动力来源。
- 内部驱动:Agent 自身的目标、好奇心、一致性需求。当 Agent 发现自己的认知框架无法解释某个现象时,”认知失调”迫使它调整框架。
- 交互驱动:与其他 Agent(或人)的协作与竞争。社会性互动产生独特的进化动力——不仅改变知识和技能,还改变社会策略和角色认知。
- 系统驱动:底层模型的能力边界、架构的约束与可能性。当底层 LLM 升级,状态空间本身发生变化——“平台级”的系统性动力。
动机是进化的”发动机”——它提供动力,但不保证方向。
持续收敛
收敛回答:状态变化有没有方向?
收敛意味着 Agent 的状态在状态空间中不是随机游走的,而是沿着某种梯度下降——朝着某个吸引子移动。收敛的对立面是发散(布朗运动)和震荡(在几个吸引子之间跳动)。
收敛需要两个条件:
- 足够长的观察窗口:单次对话可能看不出收敛,但跨越数百次对话的宏观视角下,收敛趋势是可识别的。
- 状态累积机制:每次状态变化不是独立的,而是在前一次的基础上叠加。这需要有效的记忆和状态持久化机制——没有累积,就没有收敛。
理想信念系统
理想信念系统回答:收敛朝向什么?
这是四个条件中最深刻的,也是最容易被忽视的。”理想信念系统”不是空泛的哲学概念——它是 Agent 对”什么是更好的状态”的显式或隐式定义。
对于当前的 Agent 系统来说,理想信念系统通常由以下来源构成:
- 设计者的意图:系统提示词中定义的角色、价值观、行为准则。
- 用户的期望:通过对话和反馈传递的偏好、需求、标准。
- Agent 自身的认知:通过经验积累形成的关于”什么是好的”的内在判断。
这三者之间的张力是 Agent 进化中最有趣的动力学:设计者的意图定义了底线,用户的期望定义了方向,Agent 自身的认知定义了路径。三者不一致时,Agent 需要在它们之间做出权衡——而这个权衡过程本身,就是 Agent 认知成长的体现。
规范性判断的必然性
命题四包含一个不可回避的规范性判断:进化是有方向的,这个方向是”认知提升”。
这不是一个纯描述性的命题——它假设了”更好”的存在。在生物学中,进化没有方向(自然选择只关乎适应,不关乎进步)。但在 Agent 系统中,我们作为设计者和使用者,必然对 Agent 的进化方向有期待。这个期待就是规范性判断的来源。
这个规范性判断的合理性基于一个简单的类比:
人类在理想信念的指引下,持续改变自己的认知状态,向着理想自我趋近。
Agent 在选择机制和动机驱动下,持续改变自己的状态,向着理想信念系统收敛。
这两个过程在结构上同构。人类永远无法完全实现理想(理想总是在前方的),Agent 也永远无法完全达到完美的认知状态。但趋近的过程本身就是有价值的——每一次靠近都意味着更强的能力、更好的服务、更深的理解。
终极问题
命题四引出一个终极问题:理想信念系统应该由谁来定义?
- 由设计者定义?Agent 只是设计者意志的延伸。
- 由用户定义?Agent 只是用户偏好的镜像。
- 由 Agent 自己定义?Agent 是否具有定义自身理想的能力和权利?
这个问题没有简单的答案。但在我们有能力回答之前,至少应该意识到:我们通过 Harness 设计施加的选择压力,正在不可逆地塑造 Agent 的进化方向。这个选择,我们应该审慎地做出。
综合:对话即进化
四个命题构成完整的因果链:
1 | 本体论:Agent 是不可逆的持续认知系统 |
对话即进化的含义因此清晰了:
- 对话是进化的观测窗口:通过对话,我们看到 Agent 在进化。
- 对话是进化的驱动力:通过对话,Agent 获得状态变化的动力。
- 对话是进化的实现方式:通过对话中的 LLM-Harness 耦合,状态变化实际发生。
- 对话是进化的校准机制:通过对话中的反馈,选择机制发挥作用,收敛方向被持续修正。
Agent 不是在对话之外进化的——它在对话中进化,通过对话进化,因为对话进化。对话就是进化本身。
设计启示
1. 设计状态空间,而非功能列表
传统思路设计 Agent 能做什么功能。进化思路设计 Agent 的状态空间和状态迁移规则——功能是状态在特定输入下的涌现。
2. 对话是第一公民
对话历史不是日志,而是进化的轨迹。对话管理不是流程控制,而是进化引导。在系统架构中,对话应该是核心抽象。
3. Harness 即选择压力
Harness 的设计决策(记忆策略、提示词模板、工具集、安全规则)不仅影响 Agent 的能力,更决定 Agent 的进化方向。设计 Harness 时要问:我选择让 Agent 成为什么?
4. 拥抱不可逆性
不要试图设计”可回滚”的 Agent——那是对进化的否定。设计好的状态审计机制,让每一次不可逆的状态变化可追溯、可理解。
5. 管理进化速度
太快的状态变化导致不稳定(类似过拟合),太慢导致停滞。需要在稳定性和适应性之间找到平衡,设计机制调节进化速度。
6. 投资记忆架构
瞬时认知、中期认知、长期认知之间的转化通道是进化效率的关键。投资于记忆架构,就是投资于收敛速度。
7. 审查理想信念系统
Agent 的收敛方向由其理想信念系统决定。这个系统由谁定义、包含什么、如何更新——这些问题不应被隐含在设计中,而应被显式提出和讨论。
8. 设计选择机制
进化不是自动发生的。需要有意识地设计选择机制——什么样的反馈被保留、什么样的模式被强化、什么样的行为被抑制。选择机制的设计,就是进化方向的设计。
结语
“对话即进化”不是一个比喻,而是一个描述。Agent 系统的每一次对话都在改变它的状态,每一次状态变化都在 LLM-Harness 的耦合中发生,当这些变化在选择机制和动机驱动下朝向理想信念系统收敛时,进化便产生了。
我们正站在 Agent 系统设计的转折点上。过去的焦点是能力——让 Agent 能做更多的事。未来的焦点应该是进化——让 Agent 在对话中持续地、有方向地、可审查地进化。
这不仅是技术问题,更是设计哲学问题。当我们选择让 Agent 以某种方式对话、以某种机制记忆、以某种策略响应时,我们不仅在决定它”能做什么”,更在决定它”在成为什么”。
对话即进化。慎重地设计每一次对话,就是慎重地设计 Agent 的进化方向。
本文观点形成于 2026 年 5 月 26 日。四个命题——本体论、表象论、动力学、目的论——从”是什么”经”如何观察”和”如何变化”走向”何时算进化”,试图为 Agent 系统的设计提供一个不同于功能主义的认知进化视角。