Agent Memory 每日论文综述 - 2026-05-25

2026-05-25

Agent Memory 每日论文综述

本报告自动生成自 papers.cool/arxiv/cs.AI

筛选标准：标题或摘要包含 agent、memory、RAG、episodic memory 等关键词

生成时间：2026/5/25 11:30:57

📊 今日概况

总扫描论文: 25 篇
Agent Memory 相关: 14 篇

📝 相关论文列表

1. SkillOpt: Executive Strategy for Self-Evolving Agent Skills

arXiv ID: 2605.23904 Kimi解读
核心要点: skill,skillopt,skills,codex,claude,agent,optimizer,chat,executive,gepa…
关键词: skill,skillopt,skills,codex,claude,agent,optimizer,chat,executive,gepa

2. From Raw Experience to Skill Consumption: A Systematic Study of Model-Generated Agent Skills

arXiv ID: 2605.23899 Kimi解读
核心要点: skill,skills,emph,experience,textbf,lifecycle,extractors,consumption,extraction,utility…
关键词: skill,skills,emph,experience,textbf,lifecycle,extractors,consumption,extraction,utility

3. Agentic Proving for Program Verification

arXiv ID: 2605.23772 Kimi解读
核心要点: agentic,program,verification,claude,proving,specifications,clever,scoring,isomorphism,capabilities…
关键词: agentic,program,verification,claude,proving,specifications,clever,scoring,isomorphism,capabilities

4. MemAudit: Post-hoc Auditing of Poisoned Agent Memory via Causal Attribution and Structural Anomaly Detection

arXiv ID: 2605.23723 Kimi解读
核心要点: memory,memaudit,auditing,agent,hoc,post,attack,records,causal,success…
关键词: memory,memaudit,auditing,agent,hoc,post,attack,records,causal,success

5. One Policy, Infinite NPCs: Persona-Traceable Shared RL Policies for Scalable Game Agents

arXiv ID: 2605.23652 Kimi解读
核心要点: persona,pcsp,npcs,conditioned,policy,npc,infonce,shared,policies,shot…
关键词: persona,pcsp,npcs,conditioned,policy,npc,infonce,shared,policies,shot

6. Co-ReAct: Rubrics as Step-Level Collaborators for ReAct Agents

arXiv ID: 2605.23590 Kimi解读
核心要点: react,rubrics,rubric,step,agents,reasoning,rather,decision,grpo,level…
关键词: react,rubrics,rubric,step,agents,reasoning,rather,decision,grpo,level

7. When Planning Fails Despite Correct Execution: On Epistemic Calibration for LLM-Based Multi-Agent Systems

arXiv ID: 2605.23414 Kimi解读
核心要点: epistemic,miscalibration,epc,planning,plans,feasibility,calibration,execution,llm,misjudge…
关键词: epistemic,miscalibration,epc,planning,plans,feasibility,calibration,execution,llm,misjudge

8. Human-in-the-Loop Multi-Agent Ventilator Decision Support with Contextual Bandit Preference Learning

arXiv ID: 2605.23320 Kimi解读
核心要点: ventilator,vdss,decision,clinician,bandit,contextual,preference,human,support,loop…
关键词: ventilator,vdss,decision,clinician,bandit,contextual,preference,human,support,loop

9. DART: Semantic Recoverability for Structured Tool Agents

arXiv ID: 2605.23311 Kimi解读
核心要点: dart,recoverability,commitment,rollback,downstream,committed,recovery,instance,semantic,failed…
关键词: dart,recoverability,commitment,rollback,downstream,committed,recovery,instance,semantic,failed

10. Parallel Context Compaction for Long-Horizon LLM Agent Serving

arXiv ID: 2605.23296 Kimi解读
核心要点: compaction,context,llm,parallel,horizon,agent,volume,conversation,120b,locomo…
关键词: compaction,context,llm,parallel,horizon,agent,volume,conversation,120b,locomo

11. Foundation Protocol: A Coordination Layer for Agentic Society

arXiv ID: 2605.23218 Kimi解读
核心要点: coordination,society,foundation,agentic,agents,governable,layer,negotiable,protocol,infrastructure…
关键词: coordination,society,foundation,agentic,agents,governable,layer,negotiable,protocol,infrastructure

12. Redrawing the AI Map: A Theory of Accountability Boundaries in Agentic Ecosystems

arXiv ID: 2605.23179 Kimi解读
核心要点: accountability,agentic,organizational,assets,assignable,boundaries,ecosystems,modularization,boundary,redrawing…
关键词: accountability,agentic,organizational,assets,assignable,boundaries,ecosystems,modularization,boundary,redrawing

13. Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems

arXiv ID: 2605.23109 Kimi解读
核心要点: ids,deductive,inductive,verified,agents,synthesis,expert,effort,sota,200x…
关键词: ids,deductive,inductive,verified,agents,synthesis,expert,effort,sota,200x

14. EVE-Agent: Evidence-Verifiable Self-Evolving Agents

arXiv ID: 2605.22905 Kimi解读
核心要点: eve,evidence,self,evolving,verifiable,agent,agents,answer,span,proposer…
关键词: eve,evidence,self,evolving,verifiable,agent,agents,answer,span,proposer

AI Agent Memory 深度洞察报告

1. 研究趋势

今日研究热点主要集中在AI Agent的记忆系统安全、技能演化与验证、多智能体协作以及决策可靠性方面。与往日相比，研究正从单一记忆功能转向更全面的智能体生态系统，包括记忆审计、技能消费和可验证性等维度。新兴方向包括基于因果归因的记忆攻击检测、语义可恢复性工具代理以及可验证的自演化智能体，这些研究表明AI Agent正朝着更安全、更可靠、更具协作能力的方向发展，同时强调了对智能体行为的可解释性和可追溯性的需求。

2. 技术演进

Memory系统架构正经历从简单检索增强(RAG)到复杂记忆系统的演进，再到构建世界模型的完整认知体系。早期RAG系统主要关注知识检索，而现代Memory系统如MemAudit引入了因果归因和结构异常检测，实现了对记忆污染的精确识别。DART研究则进一步提出了语义可恢复性概念，使代理在工具调用失败时能够回滚到一致状态。关键技术突破包括：1) 基于结构化代理记忆的安全审计机制；2) 技能提取与消费的生命周期管理；3) 多智能体间的协调协议层；4) 语义层面的恢复与回滚能力。这些技术共同推动AI Agent从简单信息处理向具有完整认知和决策能力的系统演进。

3. 关键洞察

洞察1: 记忆安全成为代理系统的核心挑战
MemAudit论文揭示了代理记忆面临的新型攻击威胁，通过因果归因和结构异常检测方法，可有效识别记忆污染。这提示我们构建代理系统时需将安全审计作为核心组件，实现运行后的可追溯性分析，特别是在关键应用场景中应部署多层防护机制。

洞察2: 技能生命周期管理决定代理能力上限
From Raw Experience to Skill Consumption研究表明，模型生成的代理技能需要完整的生命周期管理，从提取、存储到消费。建议在设计代理系统时建立技能库管理系统，实现技能的自动评估、版本控制和动态更新，确保代理能力的持续进化。

洞察3: 多代理系统需要协调层而非简单通信
Foundation Protocol提出作为代理社会协调层的基础协议，超越了简单的点对点通信。这表明构建复杂多代理系统需要设计专门的协调机制，包括可协商的协议和治理结构，而非仅依赖消息传递。

洞察4: 执行正确但计划失败的问题亟待解决
When Planning Fails研究指出，即使执行正确，计划本身的认知失调会导致系统失败。这提示我们需要在代理系统中引入认知校准机制，在规划阶段就评估可行性，而非仅关注执行正确性。

洞察5: 语义恢复性比简单回滚更具价值
DART研究提出的语义可恢复性超越了传统的回滚机制，能在语义层面维护一致性。这启发我们在构建代理系统时，应关注语义层面的状态管理，而不仅仅是技术层面的状态回滚。

4. 开源项目关联

今日研究与LangChain、LlamaIndex和Mem0等开源项目高度相关。MemAudit的因果归因方法可直接应用于Mem0项目，增强其记忆安全审计能力。Foundation Protocol的协调层概念可为LangChain的多代理协作提供架构参考。DART的语义恢复性机制可融入LlamaIndex的索引系统，提高其容错能力。对于MyClaw项目，值得借鉴的是SkillOpt的技能演化策略和Co-ReAct的协作式推理框架，这些技术可显著提升代理系统的自适应能力和协作效率。此外，EVE-Agent的可验证自演化机制也为MyClaw提供了构建可靠代理系统的宝贵思路。

5. 下一步行动

集成记忆安全审计模块：基于MemAudit的研究，在MyClaw项目中实现因果归因和结构异常检测功能，建立代理记忆的安全审计机制，确保系统在面对潜在攻击时的可追溯性。
构建技能管理系统：参考From Raw Experience to Skill Consumption的研究成果，设计完整的技能生命周期管理框架，包括技能提取、存储、评估和消费机制，提升代理系统的自适应能力。
开发认知校准机制：借鉴When Planning Fails的研究，在代理系统中加入认知校准模块，在规划阶段评估计划的可行性，减少”执行正确但计划失败”的问题。
实现语义恢复层：基于DART的语义可恢复性概念，在MyClaw项目中构建超越简单回滚的语义恢复机制，确保代理在工具调用失败时能保持语义一致性。
设计多代理协调协议：参考Foundation Protocol的协调层思想，为MyClaw项目设计专门的多代理协调机制，支持复杂协作场景下的协议协商和治理结构。

📚 附录

搜索关键词

agent, memory, memory-augmented, episodic, long-term, recall, retrieval, knowledge base, RAG, retrieval-augmented, episodic memory, working memory, memory system, remember, experience replay, memory network, external memory, vector database

本报告由 OpenClaw 自动生成（GLM-5 深度分析版）
面向 Agent Memory 系统设计者，提供前沿研究洞察

jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true