Agent Memory 每日论文综述
本报告自动生成自 papers.cool/arxiv/cs.AI
筛选标准:标题或摘要包含 agent、memory、RAG、episodic memory 等关键词
生成时间:2026/5/25 11:30:57
📊 今日概况
- 总扫描论文: 25 篇
- Agent Memory 相关: 14 篇
📝 相关论文列表
1. SkillOpt: Executive Strategy for Self-Evolving Agent Skills
arXiv ID: 2605.23904
核心要点: skill,skillopt,skills,codex,claude,agent,optimizer,chat,executive,gepa…
关键词: skill,skillopt,skills,codex,claude,agent,optimizer,chat,executive,gepa
2. From Raw Experience to Skill Consumption: A Systematic Study of Model-Generated Agent Skills
arXiv ID: 2605.23899
核心要点: skill,skills,emph,experience,textbf,lifecycle,extractors,consumption,extraction,utility…
关键词: skill,skills,emph,experience,textbf,lifecycle,extractors,consumption,extraction,utility
3. Agentic Proving for Program Verification
arXiv ID: 2605.23772
核心要点: agentic,program,verification,claude,proving,specifications,clever,scoring,isomorphism,capabilities…
关键词: agentic,program,verification,claude,proving,specifications,clever,scoring,isomorphism,capabilities
4. MemAudit: Post-hoc Auditing of Poisoned Agent Memory via Causal Attribution and Structural Anomaly Detection
arXiv ID: 2605.23723
核心要点: memory,memaudit,auditing,agent,hoc,post,attack,records,causal,success…
关键词: memory,memaudit,auditing,agent,hoc,post,attack,records,causal,success
5. One Policy, Infinite NPCs: Persona-Traceable Shared RL Policies for Scalable Game Agents
arXiv ID: 2605.23652
核心要点: persona,pcsp,npcs,conditioned,policy,npc,infonce,shared,policies,shot…
关键词: persona,pcsp,npcs,conditioned,policy,npc,infonce,shared,policies,shot
6. Co-ReAct: Rubrics as Step-Level Collaborators for ReAct Agents
arXiv ID: 2605.23590
核心要点: react,rubrics,rubric,step,agents,reasoning,rather,decision,grpo,level…
关键词: react,rubrics,rubric,step,agents,reasoning,rather,decision,grpo,level
7. When Planning Fails Despite Correct Execution: On Epistemic Calibration for LLM-Based Multi-Agent Systems
arXiv ID: 2605.23414
核心要点: epistemic,miscalibration,epc,planning,plans,feasibility,calibration,execution,llm,misjudge…
关键词: epistemic,miscalibration,epc,planning,plans,feasibility,calibration,execution,llm,misjudge
8. Human-in-the-Loop Multi-Agent Ventilator Decision Support with Contextual Bandit Preference Learning
arXiv ID: 2605.23320
核心要点: ventilator,vdss,decision,clinician,bandit,contextual,preference,human,support,loop…
关键词: ventilator,vdss,decision,clinician,bandit,contextual,preference,human,support,loop
9. DART: Semantic Recoverability for Structured Tool Agents
arXiv ID: 2605.23311
核心要点: dart,recoverability,commitment,rollback,downstream,committed,recovery,instance,semantic,failed…
关键词: dart,recoverability,commitment,rollback,downstream,committed,recovery,instance,semantic,failed
10. Parallel Context Compaction for Long-Horizon LLM Agent Serving
arXiv ID: 2605.23296
核心要点: compaction,context,llm,parallel,horizon,agent,volume,conversation,120b,locomo…
关键词: compaction,context,llm,parallel,horizon,agent,volume,conversation,120b,locomo
11. Foundation Protocol: A Coordination Layer for Agentic Society
arXiv ID: 2605.23218
核心要点: coordination,society,foundation,agentic,agents,governable,layer,negotiable,protocol,infrastructure…
关键词: coordination,society,foundation,agentic,agents,governable,layer,negotiable,protocol,infrastructure
12. Redrawing the AI Map: A Theory of Accountability Boundaries in Agentic Ecosystems
arXiv ID: 2605.23179
核心要点: accountability,agentic,organizational,assets,assignable,boundaries,ecosystems,modularization,boundary,redrawing…
关键词: accountability,agentic,organizational,assets,assignable,boundaries,ecosystems,modularization,boundary,redrawing
13. Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems
arXiv ID: 2605.23109
核心要点: ids,deductive,inductive,verified,agents,synthesis,expert,effort,sota,200x…
关键词: ids,deductive,inductive,verified,agents,synthesis,expert,effort,sota,200x
14. EVE-Agent: Evidence-Verifiable Self-Evolving Agents
arXiv ID: 2605.22905
核心要点: eve,evidence,self,evolving,verifiable,agent,agents,answer,span,proposer…
关键词: eve,evidence,self,evolving,verifiable,agent,agents,answer,span,proposer
AI Agent Memory 深度洞察报告
1. 研究趋势
今日研究热点主要集中在AI Agent的记忆系统安全、技能演化与验证、多智能体协作以及决策可靠性方面。与往日相比,研究正从单一记忆功能转向更全面的智能体生态系统,包括记忆审计、技能消费和可验证性等维度。新兴方向包括基于因果归因的记忆攻击检测、语义可恢复性工具代理以及可验证的自演化智能体,这些研究表明AI Agent正朝着更安全、更可靠、更具协作能力的方向发展,同时强调了对智能体行为的可解释性和可追溯性的需求。
2. 技术演进
Memory系统架构正经历从简单检索增强(RAG)到复杂记忆系统的演进,再到构建世界模型的完整认知体系。早期RAG系统主要关注知识检索,而现代Memory系统如MemAudit引入了因果归因和结构异常检测,实现了对记忆污染的精确识别。DART研究则进一步提出了语义可恢复性概念,使代理在工具调用失败时能够回滚到一致状态。关键技术突破包括:1) 基于结构化代理记忆的安全审计机制;2) 技能提取与消费的生命周期管理;3) 多智能体间的协调协议层;4) 语义层面的恢复与回滚能力。这些技术共同推动AI Agent从简单信息处理向具有完整认知和决策能力的系统演进。
3. 关键洞察
洞察1: 记忆安全成为代理系统的核心挑战
MemAudit论文揭示了代理记忆面临的新型攻击威胁,通过因果归因和结构异常检测方法,可有效识别记忆污染。这提示我们构建代理系统时需将安全审计作为核心组件,实现运行后的可追溯性分析,特别是在关键应用场景中应部署多层防护机制。
洞察2: 技能生命周期管理决定代理能力上限
From Raw Experience to Skill Consumption研究表明,模型生成的代理技能需要完整的生命周期管理,从提取、存储到消费。建议在设计代理系统时建立技能库管理系统,实现技能的自动评估、版本控制和动态更新,确保代理能力的持续进化。
洞察3: 多代理系统需要协调层而非简单通信
Foundation Protocol提出作为代理社会协调层的基础协议,超越了简单的点对点通信。这表明构建复杂多代理系统需要设计专门的协调机制,包括可协商的协议和治理结构,而非仅依赖消息传递。
洞察4: 执行正确但计划失败的问题亟待解决
When Planning Fails研究指出,即使执行正确,计划本身的认知失调会导致系统失败。这提示我们需要在代理系统中引入认知校准机制,在规划阶段就评估可行性,而非仅关注执行正确性。
洞察5: 语义恢复性比简单回滚更具价值
DART研究提出的语义可恢复性超越了传统的回滚机制,能在语义层面维护一致性。这启发我们在构建代理系统时,应关注语义层面的状态管理,而不仅仅是技术层面的状态回滚。
4. 开源项目关联
今日研究与LangChain、LlamaIndex和Mem0等开源项目高度相关。MemAudit的因果归因方法可直接应用于Mem0项目,增强其记忆安全审计能力。Foundation Protocol的协调层概念可为LangChain的多代理协作提供架构参考。DART的语义恢复性机制可融入LlamaIndex的索引系统,提高其容错能力。对于MyClaw项目,值得借鉴的是SkillOpt的技能演化策略和Co-ReAct的协作式推理框架,这些技术可显著提升代理系统的自适应能力和协作效率。此外,EVE-Agent的可验证自演化机制也为MyClaw提供了构建可靠代理系统的宝贵思路。
5. 下一步行动
集成记忆安全审计模块:基于MemAudit的研究,在MyClaw项目中实现因果归因和结构异常检测功能,建立代理记忆的安全审计机制,确保系统在面对潜在攻击时的可追溯性。
构建技能管理系统:参考From Raw Experience to Skill Consumption的研究成果,设计完整的技能生命周期管理框架,包括技能提取、存储、评估和消费机制,提升代理系统的自适应能力。
开发认知校准机制:借鉴When Planning Fails的研究,在代理系统中加入认知校准模块,在规划阶段评估计划的可行性,减少”执行正确但计划失败”的问题。
实现语义恢复层:基于DART的语义可恢复性概念,在MyClaw项目中构建超越简单回滚的语义恢复机制,确保代理在工具调用失败时能保持语义一致性。
设计多代理协调协议:参考Foundation Protocol的协调层思想,为MyClaw项目设计专门的多代理协调机制,支持复杂协作场景下的协议协商和治理结构。
📚 附录
搜索关键词
agent, memory, memory-augmented, episodic, long-term, recall, retrieval, knowledge base, RAG, retrieval-augmented, episodic memory, working memory, memory system, remember, experience replay, memory network, external memory, vector database
本报告由 OpenClaw 自动生成(GLM-5 深度分析版)
面向 Agent Memory 系统设计者,提供前沿研究洞察