eBay支付风险Agent记忆系统实践:从Agentic RAG到可进化的混合知识图谱
导语
在大模型Agent从单次对话向具备长期记忆系统演进的浪潮中,企业级落地面临着真实的鸿沟:通用大模型缺乏对企业内部概念的精确理解,更缺乏业务全局观。在eBay支付风险团队面临的EDP(eBay Decision Platform)迁移场景中,我们需要将复杂的Java风控逻辑转化为配置化规则。这一过程涉及大量的内部概念对齐与多跳推理,如果没有记忆系统,Agent极易产生迁移错误;而如果记忆系统设计不当,又会陷入局部视野与知识冲突的陷阱。
本文将复盘eBay支付风险团队构建Agent记忆系统的演进路径:从初期的Agentic RAG,到引入静态与动态结合的混合知识图谱,再到基于Graphiti实现记忆的有机进化,以及如何构建保障安全性的评估体系。
核心问题与挑战
在EDP迁移场景下,让Agent辅助风控规则迁移,我们面临四个核心挑战:
- 内部概念与全局观缺失:LLM不懂eBay内部的风控术语与业务拓扑,导致迁移张冠李戴。
- 纯向量检索的盲区:面对“该规则依赖了哪些模型,这些模型又关联了哪些变量?”的多跳推理,纯向量检索基于局部相似性,无法胜任全局拓扑查询。
- 静态记忆的冲突与过时:风控规则高频变更,同一概念在不同检查点命名不同(实体歧义),静态知识库无法处理版本冲突与交互反馈,导致知识自相矛盾。
- 记忆更新的回归风险:记忆动态更新后,可能破坏原本正确的推理路径,引发隐性回归错误。
方案与实践
阶段一:Agentic RAG —— 解决特定查询的高效召回
作为初始方案,我们构建了包含初始化、检索、成长三阶段的Agentic RAG长期记忆系统:
- 初始化阶段:对历史代码与配置进行预清洗、分块、丰富与向量化存储。
- 检索阶段:采用多视角查询增强、混合检索与重排序策略,提升召回精度。
- 成长阶段:引入非个性化的反馈知情机制,让记忆库随交互逐步丰富。
该方案有效解决了指定查询的准确率与召回问题,辅助了错误处理与概念问答。但很快我们触达了瓶颈:RAG缺乏全局视角,且无法解决程序性记忆(如何做迁移)的冲突,Agent无法进行有效的自主探索。
阶段二:混合知识图谱 —— 突破全局推理与程序性记忆瓶颈
为突破纯向量检索的局限,我们引入了知识图谱(KG),并采用静态与动态结合的混合Schema:
- 静态图谱(结构骨架):收敛于通用概念(如Checkpoint、Rule、Model等),提供全局拓扑视角。
- 动态图谱(事件与反馈):承载业务特例与交互沉淀。
构建策略与人机协同
构建静态图谱时,我们坚持“用例驱动、稳定性优先、可对齐”三大策略。在工程落地上,我们通过JSON Schema作为契约,利用Claude Code探索代码库与配置,人类制定提取逻辑,Agent严格执行生成图谱,实现“人类掌控规则,Agent高效执行”。
技能即程序性记忆
我们将图谱构建与迁移流程沉淀为可复用的Agent Skill(基于自然语言规范描述目标与边界)。这在认知框架上,将Agent Skills映射为人类的程序性记忆(“我知道如何做X”),补齐了RAG阶段缺失的执行经验。
阶段三:记忆进化 —— 基于Graphiti的有机体生长
混合KG解决了结构问题,但实体歧义与交互反馈的沉淀仍需动态机制。我们将记忆视为可生长、可纠错的有机体,引入Graphiti实现记忆的动态进化:
- 双时态模型:每个事实携带两个时间戳——事件发生的时间与我们知晓的时间,精准追踪知识时效。
- 实体解析与冲突解决:当新知识写入时,自动对齐不同检查点中的同名概念,解决语义冲突。
- 分工协同:静态KG掌握结构,Graphiti掌握发生了什么与我们学到了什么。两者结合,形成了语义记忆(静态结构)、情景记忆(动态事件)与程序性记忆(Skills)的三层有机架构。
阶段四:质量保障 —— 记忆评估体系
记忆的进化必须受控。我们基于DeepEval与黄金用例构建了三层评估体系:
- 检索正确性:Agent是否检索到了正确的记忆节点。
- 回答忠实度:生成的回答是否严格基于检索到的记忆,而非幻觉。
- 回归安全性:基于黄金用例的任务级回归测试,确保记忆更新不会破坏原有正确的迁移任务。
原则/方法论沉淀
在构建Agent记忆系统的过程中,我们沉淀了四条核心工程原则:
- Think big, start small:从真实的业务问题出发,精准定义问题,不要一开始就追求万能架构。
- Stability first:静态图谱的核心必须收敛于通用概念,绝不能将高频变更的业务特例下沉到基础骨架中。
- Human owns the rules:人类制定提取逻辑与规则边界,Agent严格执行,严禁Agent自行解释或越权发挥。
- Memory as an organism:记忆不是静态的数据库,而是随交互生长、自我纠错与进化的有机体。
总结与行动建议
从Agentic RAG到混合知识图谱,再到动态进化的有机记忆,eBay支付风险Agent的记忆系统演进,本质上是不断弥补LLM局部视野与静态知识缺陷的过程。对于准备构建企业级Agent记忆系统的团队,我们的行动建议是:
- 起步期:用Agentic RAG快速解决长尾概念QA与单跳查询问题,积累初始数据。
- 瓶颈期:当业务出现明显的多跳推理与全局拓扑需求时,果断引入静态KG,并用JSON Schema约束人机协同构建流程。
- 进化期:面对概念歧义与知识更新,引入双时态模型与实体解析机制,让记忆具备自我对齐与纠错能力。
- 底线:在任何记忆更新环节,必须配备基于黄金用例的回归测试,守住业务正确性的底线。
开放问题与延伸方向
- Graphiti的双时态模型在eBay支付风控这种高频变更场景下,其实际的写入延迟与查询吞吐量基准表现如何? —— 正文聚焦架构演进,生产落地需补充具体的性能基准数据。
- 将记忆视为可自我纠错的“有机体”,在金融风控这种容错率极低的业务中,是否潜藏着不可解释的失控直觉担忧? —— 有机体理念需配合严格评估,避免低容错业务中的不可解释性。
- 当动态图谱中的业务特例随交互无限膨胀时,如何防止其反噬静态KG的稳定性,导致系统可维护性崩溃? —— 需设定动态图谱的边界与裁剪机制,防止无限膨胀破坏核心骨架。
- 在高频并发的风控规则更新下,Graphiti的实体解析与冲突解决机制如何避免图谱状态的脏写或推理死锁? —— 冲突解决机制在并发写入下的鲁棒性是工程落地的关键考验。
- 基于DeepEval的单查询评估和黄金用例回归,能否真正捕捉到多跳推理中因记忆动态更新导致的隐性回归错误? —— 当前评估体系侧重单查询与任务级,多跳推理链路的隐性破坏仍是检测难点。
- 将Agent Skills映射为程序性记忆并沉淀为可复用资产,这种模式能否低成本泛化至eBay推荐或客服等异构业务域? —— 程序性记忆的沉淀模式具备跨域复用潜力,值得探索其泛化成本。
- 静态KG作骨架、Graphiti作血肉的混合架构,是否在当前大模型企业落地中,于工程复杂度与推理能力间取得了最佳平衡? —— 该架构是当前工程约束下的较优解,平衡了确定性与灵活性。
- 若引入图神经网络(GNN)对Graphiti沉淀的动态事件子图进行表征学习,能否突破LLM提取的局限,实现风控模式的自动发现? —— 基于动态子图的GNN表征学习,可能成为突破LLM提取上限的新路径。
- 假设突破“Human owns the rules”原则,允许Agent在隔离沙盒中通过强化学习自主演化Schema,是否可能颠覆当前人机协同的效率上限? —— 自主演化Schema是激进但具想象力的方向,需在安全沙盒内验证。
- 从Agentic RAG演进到混合知识图谱架构,驱动这一架构跃迁的量化拐点或核心判据究竟是什么? —— 架构跃迁不能仅凭直觉,需明确如多跳查询失败率等量化触发指标。
- 审视整个记忆系统的生命周期,当前最大的工程瓶颈是图谱构建的人力成本、LLM推理延迟,还是评估体系的覆盖度? —— 人力、延迟与评估覆盖度是后续迭代需持续博弈的三角瓶颈。