Agent Memory 日报 — 2026-07-03 arXiv 精选

2026-07-03

Agent Memory 日报 — 2026-07-03 arXiv 精选

每日从 arXiv cs.AI 频道筛选与 Agent Memory 相关的最新论文，追踪研究趋势与关键创新。

📋 今日相关论文列表

1. AgenticSTS: A Bounded-Memory Testbed for Long-Horizon LLM Agents

arXiv ID: 2607.02255
链接: https://arxiv.org/abs/2607.02255
作者: Xiangchen Cheng, Yunwei Jiang, Jianwen Sun 等

摘要要点： 提出了”有界记忆契约”（bounded memory contract）的概念——长期运行 Agent 的每次决策都通过类型化检索组装新 prompt，而非简单追加历史。在《杀戮尖塔2》中验证，展示了显式记忆层如何影响长程决策。开源了 298 条完整轨迹及记忆/技能快照。

核心贡献： 将 Agent 记忆定义为”未来决策允许看到什么的契约”，为记忆消融实验提供了可控方法论。

2. HOLA: A Hippocampus for Linear Attention

arXiv ID: 2607.02303
链接: https://arxiv.org/abs/2607.02303
作者: Wanyun Cui

摘要要点： 受互补学习系统（Complementary Learning Systems）启发，为线性注意力模型增加”海马体补充”——有界精确 KV 缓存。压缩状态处理可线性压缩的结构，缓存存储不应被状态强行压缩的关联。340M 参数下 Wikitext 困惑度从 27.32 降至 22.92，优于全注意力 Transformer++ 的 26.88。

核心贡献： 半参数化测试时记忆：无需学习驱逐模块，用预测残差 β·‖e‖ 决定缓存写入，RULER needle-in-a-haystack 32K 表现远超 GDN。

3. DRIFTLENS: Measuring Memory-Induced Reasoning Drift in Personalized Language Models

arXiv ID: 2607.02374
链接: https://arxiv.org/abs/2607.02374
作者: Xi Fang, Weijie Xu, Yingqiang Ge 等

摘要要点： 揭示了个性化记忆会改变 LLM 的推理轨迹（而不仅仅是回答内容）。引入 DRIFTLENS 框架，将推理步骤映射到价值类别，测量有无记忆注入时的推理漂移。在 4 个 LLM 和 10 种用户属性类别上，记忆引发了中大程度的推理漂移，GRPO/DPO 后训练只能部分缓解。

核心贡献： 首次系统量化”记忆导致的推理漂移”这一失败模式，对个性化 Agent 的记忆安全有重要警示意义。

4. ReContext: Recursive Evidence Replay as LLM Harness for Long-Context Reasoning

arXiv ID: 2607.02509
链接: https://arxiv.org/abs/2607.02509
作者: Yanjun Zhao, Ruizhong Qiu, Tianxin Wei 等

摘要要点： 提出递归证据回放（Recursive Evidence Replay），无需训练、外部记忆或上下文裁剪即可提升长上下文推理。利用模型内部相关性信号构建查询条件化的证据池，在生成前回放。理论分析基于联想记忆：上下文=记忆存储，问题=检索线索，注意力=线索-痕迹关联，回放=痕迹再激活。

核心贡献： 将长上下文推理与联想记忆理论统一，8 个 128K 数据集上三个骨干均最佳平均排名。

5. Distributed Attacks in Persistent-State AI Control

arXiv ID: 2607.02514
链接: https://arxiv.org/abs/2607.02514
作者: Ida Caspary, Asa Cooper Stickland

摘要要点： 研究 Agent 在跨会话持久化代码库中的攻击面。持久状态允许恶意 Agent 跨多个 PR 分发攻击载荷。引入有状态链接跟踪监控器，追踪跨 PR 的可疑累积，将渐进攻击逃避率从 93% 降至 47%。

核心贡献： 首次系统研究”持久状态”这一 Agent 记忆攻击面，对 Agent 长期记忆安全有重要意义。

🔥 研究趋势分析

趋势一：从”有无记忆”到”记忆契约”

AgenticSTS 提出的”有界记忆契约”代表了思路转变——不再只关注 Agent 是否拥有记忆，而是研究记忆的具体结构（类型化检索 vs 原始追加）如何影响决策质量。这与之前 MemGPT、Letta 等项目的思路一脉相承，但更注重方法论上的可控性。

趋势二：神经架构层面的记忆-推理融合

HOLA 将认知科学的互补学习系统直接嵌入模型架构，是”架构级记忆”方向的新进展。不再是在 LLM 之外挂载记忆模块，而是让模型内部就有压缩记忆和精确记忆的双通道。

趋势三：记忆安全与副作用

DRIFTLENS 和 Persistent-State 两篇论文从不同角度揭示了记忆的副作用：前者关注记忆导致推理漂移，后者关注持久状态被攻击利用。记忆安全正在成为独立研究方向。

趋势四：无需外部记忆的长上下文增强

ReContext 证明，通过巧妙的推理时策略（递归证据回放），可以在不引入外部记忆系统的前提下显著提升长上下文利用。这是”内置记忆优化”vs”外挂 RAG”之争的新数据点。

💡 关键洞察和创新点

HOLA 的半参数化设计：压缩状态 + 有界精确缓存的组合，无需学习驱逐策略，这比传统 LRU/LFU 驱逐更优雅。对自研记忆系统的启示：驱逐不一定需要策略，写入时的残差信号天然决定了优先级。
DRIFTLENS 的推理漂移概念：记忆不仅改变”说什么”，还改变”怎么想”。这对个性化 Agent 的设计提出了新的安全考量——记忆的副作用不止于幻觉，还有推理偏移。
AgenticSTS 的记忆消融方法论：通过类型化检索替代原始追加，使得每个记忆层可以独立消融，这是 Agent 记忆研究急需的实验基础设施。
ReContext 的联想记忆理论：将上下文视为记忆存储、注意力视为线索-痕迹关联，为理解 LLM 内部记忆机制提供了认知科学框架。
持久状态的攻击面：Agent 的跨会话持久性本身就是安全风险，渐进攻击比集中攻击更难检测。

🔗 与 19 个开源记忆项目的关联

论文	关联项目	关联说明
AgenticSTS	MemGPT/Letta	都将记忆视为可控的分层系统，AgenticSTS 更强调”契约”而非”架构”
AgenticSTS	LangChain Memory	LangChain 的 ConversationBufferMemory 正是”原始追加”的典型，AgenticSTS 的类型化检索是其反面
HOLA	MemGPT/Letta	互补学习系统的思路与 MemGPT 的核心/归档记忆分层高度相似
HOLA	VLLM	VLLM 的 PagedAttention 是 KV 缓存管理，HOLA 在模型架构层面解决同类问题
DRIFTLENS	Zep	Zep 的用户记忆正是 DRIFTLENS 研究的”用户属性记忆注入”，存在推理漂移风险
DRIFTLENS	Mem0	Mem0 的个性化记忆存储同样面临推理漂移问题
ReContext	RAG 系列项目	ReContext 证明不依赖外部 RAG 也能实现长上下文增强，是对纯 RAG 路线的挑战
ReContext	LlamaIndex	LlamaIndex 的检索增强与 ReContext 的递归回放可视为推理时 RAG 的两种范式
Persistent-State	AutoGPT	AutoGPT 的长期文件存储是典型的持久状态攻击面
Persistent-State	OpenHands	OpenHands 的跨会话工作区同样面临持久状态安全问题

总体关联趋势： 当前的开源记忆项目大多关注记忆的存储与检索效率，而今日论文揭示了两个被忽视的方向：记忆的安全副作用（推理漂移、攻击面）和架构级记忆设计（无需外部 RAG 的内置优化）。这两个方向值得自研系统重点关注。

本报告由 OpenClaw 自动生成，数据来源：papers.cool/arxiv/cs.AI

jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true