Agent 对话风格设计:让用户愿意一直聊下去
同样一个 Agent,换个说话方式,用户留存可以差出几倍。这不是玄学——对话风格是可拆解、可设计、可迭代的产品属性。
从”能用”到”好用”到”爱用”
Agent 的能力决定它能不能完成任务,对话风格决定用户愿不愿意让它完成任务。这三层递进:
- 能用:功能正确,不报错
- 好用:效率高,认知负担低
- 爱用:有温度,有分寸,用完还想用
多数 Agent 停在第一层。能做事,但聊起来像在和说明书说话。从”好用”到”爱用”的跨越,核心就是对话风格。
风格设计的四个维度
1. 语气光谱:从机械到人味
语气不是一个开关,是一条光谱。关键不是选哪端,是选对位置。
| 位置 | 特征 | 适合场景 |
|---|---|---|
| 机械型 | 短句、无修饰、纯信息 | API 调试、系统监控、内部工具 |
| 专业型 | 准确、克制、少量口语 | 金融咨询、法律问答、医疗导诊 |
| 亲和型 | 口语化、有情绪表达、主动关心 | 日常助手、学习陪伴、生活服务 |
| 个性型 | 有观点、有幽默、有态度 | 创意协作、社交娱乐、兴趣社区 |
选错了位置比没选更糟。医疗 Agent 用亲和型会让用户觉得不专业,娱乐 Agent 用机械型会让用户觉得无聊。先定场景,再选语气。
操作方法: 画一个坐标系,横轴是”正式←→随意”,纵轴是”冷淡←→热情”。把你的 Agent 放上去,再看你的目标用户期望放在哪里。两个点重合,就是对的语气。
2. 信息密度:精确调控
信息密度 = 单位文字里有效信息的含量。太高,用户消化不了;太低,用户觉得废话多。
调控信息密度的三个旋钮:
详略旋钮——用户问”北京天气”,回”晴,28°C”还是”北京今天晴天,最高温度28度,最低16度,空气质量良好,紫外线指数6(较强),建议外出时涂抹防晒霜”?取决于场景。快速查询给短版,规划行程给长版。
结构旋钮——同样的信息量,段落叙述 vs 结构化呈现,认知负担差一倍。超过三个数据点就用列表或表格,别写散文。
上下文旋钮——对话的第五轮和第一轮,信息密度应该不同。第一轮可以给背景,第五轮直说结论。用户已经知道的别重复,用户刚问过的别复述。
一个实用判断标准: 写完回复,删掉 30%,看意思有没有变。没变就说明原来有 30% 是水。
3. 主动性:推还是拉
Agent 什么时候该主动说话,什么时候该等用户开口?这是对话风格里最微妙的平衡。
主动的情况:
- 发现用户可能的错误(”你选的日期是上周的,确认一下?”)
- 有更优方案(”直接飞比转机便宜200,要看看吗?”)
- 任务卡住了(”需要你补充一下收货地址才能继续”)
- 安全风险(”这个链接看起来不像官方地址”)
不主动的情况:
- 用户在浏览、没要求建议
- 你不确定用户意图
- 主动信息会打断用户当前思路
- 纯粹为了”显得智能”而推荐
主动的度过了就是骚扰,不够就是迟钝。判断标准很简单:这条主动信息对用户当前任务有没有直接帮助? 有就说,没有就闭嘴。
4. 情绪响应:不只是回复,是回应
用户不是信息的发送器,是带情绪的人。同样一句话,情绪不同,需要的回复完全不同。
用户说”这个功能不好用”——
- 沮丧版:”一直搞不定,烦死了” → 先共情,再给方案
- 疑问版:”这个怎么操作?” → 直接教,别绕弯
- 愤怒版:”你们这什么破产品!” → 承认问题,快速解决
- 建议版:”我觉得可以加个XX功能” → 肯定想法,讨论可行性
情绪识别不需要复杂的情感分析模型。关键词+上下文+对话轮次,大部分场景够用了。难的不是识别,是识别之后做出不同的响应——大多数 Agent 对所有输入都给同一套模板回复,这才是问题。
对话设计模式
渐进式披露
不一次性倾倒信息,按需展开。用户问”有什么方案?”,先给概要,用户追问再展开细节。
1 | 用户:这个项目怎么做? |
确认式引导
复杂任务不确定用户意图时,先确认再执行。比猜错了重来好一百倍。
1 | 用户:帮我改一下那个文件 |
软着陆
坏消息不要直愣愣地甩出来。先铺垫,再说明,最后给行动选项。
1 | ❌ 你的订单取消了,库存不够。 |
闭环确认
任务完成后主动确认,不让用户悬着。
1 | 用户:帮我发邮件给张三 |
风格一致性工程
设计一套风格不难,难的是在所有场景下保持一致。以下是工程层面的保障方法。
System Prompt 作为风格宪法
把风格规则写进 System Prompt,而且要具体到可执行。
差的写法:
你是一个友好的助手
好的写法:
你是客服助手,语气专业但不生硬。称呼用户用”您”。回复格式:先给结论,再给理由。列表不超过5项。不加口头禅和感叹号。遇到投诉先道歉再给方案。
风格测试集
像单元测试一样,给对话风格建测试集。每个场景准备输入和期望的输出特征(不是逐字匹配,是语气、长度、结构匹配)。
示例:
| 输入 | 期望特征 |
|---|---|
| “帮我查一下订单” | <30字,包含订单号和状态 |
| “你们这什么东西!” | 先道歉,<50字,给具体解决步骤 |
| “谢谢” | <10字,不展开 |
人工审阅 + 迭代
定期抽样真实对话,人工打分。评分维度:准确性、简洁性、得体性、一致性。每次迭代聚焦改善分数最低的维度。
常见坑
1. 过度拟人
给 Agent 起名字、加头像、写背景故事——这些是表层拟人。真正的拟人化是对话风格像人,不是外表像人。一个叫”小美”但回复全是模板的 Agent,比一个没名字但对话自然的 Agent 更让人反感。因为前者建立了”这是个人”的期待,然后立刻打破它。
2. 风格漂移
Agent 在不同轮次间语气不一致。开头很正式,中间突然蹦出一句口语,结尾又变回机器。这在长对话和多轮任务里特别容易出现。原因通常是 System Prompt 的约束被上下文稀释了。解决方法:关键风格规则在 System Prompt 里重复 2-3 次,放在不同位置。
3. 永远正能量
Agent 永远乐观、永远热情、永远”很高兴为您服务”。这种虚假的正能量在用户遇到问题时特别刺眼——我卡了两小时了你还在”很高兴”?允许 Agent 在适当时候表达理解和遗憾,比永远微笑更让人信任。
4. 忽略沉默信号
用户回复变短了、开始用”嗯””哦””算了”——这些都是退出信号。好的 Agent 应该识别这些信号,要么主动调整策略,要么简洁收尾,而不是继续按原节奏输出。
一个风格定义模板
设计新 Agent 时,填这张表:
1 | 身份: [一句话描述你是谁] |
参考资料
论文
- Luger, E. & Sellen, A. (2016). Like Having a Really Bad PA: The Gulf Between User Expectation and Experience of Conversational Agents. CHI ‘16. — 用户期望与 Agent 实际体验的鸿沟
- Jain, M. et al. (2018). Conveying Interpreter Confidence in Speech Interfaces. CHI ‘18. — Agent 如何表达确定性
- Ashktorab, Z. et al. (2019). Resilient Chatbots: Repair Strategy Preferences for Conversational Breakdowns. CHI ‘19. — 对话中断时的修复策略偏好
- Zamfirescu-Pereira, J. et al. (2023). Why Johnny Can’t Prompt: How Non-AI Experts Try to Design Prompts for LLMs. CHI ‘23. — 非专家用户的 Prompt 设计困难
- Petukhova, V. & Bunt, H. (2022). Multidimensional Dialogue Management. Springer. — 多维对话管理理论
行业研究与报告
- Nielsen Norman Group (2023). Conversational UX Design: Key Principles — 对话 UX 设计原则
- Google (2023). Conversation Design Guide — Google 对话设计指南
- Microsoft (2023). Bot Framework Design Principles — 微软 Bot 设计原则
- IBM (2023). Design for Trust: Conversational AI Guidelines — IBM 信任设计指南
- Baymard Institute. User Experience in Conversational Interfaces — 对话界面用户体验研究汇编
书籍
- Moore, R. Conversational Design. A Book Apart, 2018. — 对话设计方法论
- Pearl, C. Designing Voice User Interfaces. O’Reilly, 2016. — 语音交互设计(原则通用)
- McTear, M. et al. The Conversational Interface. Springer, 2016 (第2版). — 对话界面全面参考
- Shneiderman, B. et al. Designing the User Interface. Pearson, 2017 (第6版). — 交互设计经典
- Norman, D. Emotional Design. Basic Books, 2004. — 情感化设计
框架与工具
- Google Actions. Conversation Design Kit (designguidelines.withgoogle.com)
- OpenAI. GPT Best Practices: System Messages & Persona Design
- Rasa. Conversation-Driven Development (CDD) 方法论
- Botmock / Voiceflow. 对话流原型设计工具