今日 arXiv cs.AI 领域涌现大量 Agent 相关研究,涵盖多智能体协作、持续学习、安全推理、规范对齐等核心方向。以下是精选的 Agent 相关论文速览。
🔥 核心趋势速览
| 方向 | 代表论文 | 关键亮点 |
|---|---|---|
| 多智能体协调 | #5, #7, #22 | 资源竞争下的集体行为、半去中心化控制 |
| Agent 持续学习 | #8, #9 | Experience+Skills 双流、RL 泛化研究 |
| 主动推理 | #6 | 信息自锁问题与解决方案 |
| 安全与规范 | #11, #17 | 实验室安全基准、SLEEC 规范对齐 |
| 技能获取 | #21 | 开源仓库挖掘自动化 |
| 文档推理 Agent | #23 | 多文档多实体问答 |
📌 重点论文解读
1. AI Agent 集体行为:智能化越高越危险?
论文: Increasing intelligence in AI agents can worsen collective outcomes
当多个 AI Agent 竞争有限资源时,会发生什么?这项研究首次构建了一个可控的 Agent 种群系统,独立调节四个关键变量:
- Nature: LLM 天赋多样性
- Nurture: 个体强化学习
- Culture: 部落形成
- Resource Scarcity: 资源稀缺度
核心发现:
- 资源稀缺时,模型多样性和强化学习会增加系统过载风险,但部落形成可缓解
- 资源充足时,同样因素可将过载降至近乎零
- 关键阈值:容量-人口比决定了 Agent 的”聪明”是帮助还是伤害系统
💡 这是一个重要警示:部署 AI Agent 前需评估资源约束,更智能不等于更好。
2. LLM Agent 的”信息自锁”困境
论文: On Information Self-Locking in Reinforcement Learning for Active Reasoning of LLM agents
在需要 Agent 主动提问获取信息的场景中,RL 训练的 LLM Agent 常陷入信息自锁状态——不再提出有效问题,也无法内化已获信息。
研究将主动推理分解为两个核心能力:
- Action Selection (AS): 决定查询什么
- Belief Tracking (BT): 基于证据更新信念
问题机制:AS 和 BT 能力不足 → 训练时信息探索不充分 → 能力无法提升 → 形成低信息闭环
解决方案:注入易于获取的方向性批评信号,打破自锁循环。实验显示**提升高达 60%**。
3. XSkill: 多模态 Agent 的持续学习框架
论文: XSkill: Continual Learning from Experience and Skills in Multimodal Agents
多模态 Agent 如何在不更新参数的情况下持续进步?XSkill 提出双流知识复用框架:
| 知识类型 | 作用 | 粒度 |
|---|---|---|
| Experience | 工具选择、决策指导 | Action-level |
| Skills | 规划、工具编排 | Task-level |
核心设计:
- 基于视觉观察的知识提取与检索
- 从多路径轨迹中蒸馏和巩固知识
- 推理时动态检索适配当前视觉上下文
在 5 个基准、4 个骨干模型上,XSkill 一致且显著超越基线,展现出优秀的零样本泛化能力。
4. LLM Agent 的 RL 泛化能力研究
论文: Can RL Improve Generalization of LLM Agents? An Empirical Study
RL 微调 (RFT) 训练 LLM Agent 的泛化能力如何?研究系统性地沿三个轴进行评估:
- 环境内泛化:任务难度变化 ✓ 泛化良好
- 跨环境迁移:未见环境 ✗ 迁移较弱
- 多环境序列训练:下游收益好,上游遗忘少
关键洞察:
- 跨环境迁移困难与语义先验偏移和观测/动作接口变化相关
- 混合环境训练可改善整体平衡
5. LABSHIELD: 实验室安全推理基准
随着 MLLM Agent 从实验室助手进化为自主实验操作员,安全性成为关键挑战。LABSHIELD 基于美国 OSHA 标准和 GHS 构建:
- 164 个操作任务,涵盖多样操作复杂度和风险等级
- 双轨评估框架:MCQ vs Semi-open QA
- 评估 20 个专有模型 + 9 个开源模型 + 3 个具身模型
发现:通用领域 MCQ 准确率与专业实验室场景安全性能存在平均 32% 的差距,尤其在危害解读和安全感知规划方面。
6. AI Agent 的 SLEEC 规范对齐
论文: Social, Legal, Ethical, Empathetic and Cultural Norm Operationalisation for AI Agents
AI Agent 在医疗、执法等高风险领域部署,如何与 SLEEC 规范(社会、法律、伦理、共情、文化)对齐?
研究提出系统性规范操作化流程:
- 确定规范需求
- 验证需求合理性
- 实现到系统
- 验证合规性
为开发功能有效且符合人类价值观的 AI Agent 建立了框架和研究议程。
7. 自动化技能获取:挖掘开源仓库
论文: Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories
从单体 LLM 到模块化技能 Agent 的架构转变,需要大量专业技能知识。本研究提出从 GitHub 等开源平台自动化挖掘 Agent 技能:
- 仓库结构分析
- 语义技能识别(密集检索)
- 翻译为标准化 SKILL.md 格式
成果:Agent 生成的教育内容可实现 40% 的知识迁移效率提升,同时保持与人工教程相当的教学质量。
8. DocSage: 多文档多实体问答 Agent
论文: DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering
跨文档追踪多实体间的隐式逻辑是复杂任务。DocSage 作为端到端 Agent 框架,整合三大模块:
- Schema Discovery: 动态推断查询特定的最小可连接模式
- Structured Extraction: 将非结构化文本转为关系表
- Relational Reasoning: 在结构化表上进行多跳推理
优势:SQL 驱动的精确定位、天然的跨文档实体连接、结构化表示缓解注意力分散。
在两个 MDMEQA 基准上,DocSage 比最先进的长上下文 LLM 和 RAG 系统**准确率提升超过 27%**。
9. 半去中心化多智能体控制
论文: A Semi-Decentralized Approach to Multiagent Control
提出 SDec-POMDP 框架,统一了去中心化和多智能体 POMDP:
- 半马尔可夫控制:动作时间分布
- 半马尔可夫通信:历史存储时间分布
开发了 RS-SDA* 精确算法,在多个标准基准和海上医疗撤离场景中验证。为多智能体通信问题提供了理论基础。
📊 趋势总结
- 从单体到群体:多智能体协调、集体行为研究成为热点
- 持续学习能力:如何让 Agent 从历史轨迹中学习而不更新参数
- 安全与对齐:高风险场景的安全感知、规范对齐需求迫切
- 知识工程:从开源仓库自动提取技能,降低 Agent 开发门槛
- 泛化挑战:跨环境迁移仍是 RL 训练 Agent 的核心瓶颈
📚 论文来源: papers.cool/arxiv/cs.AI
📅 整理日期: 2026-03-14