问题:用户只会“以貌取AI”?

上周Rachel Ward面对外貌批评的回应火了——她直接说“我对我的脸很满意,你们需要的是成长”。作为设计师,这种“我不需迎合你”的自信其实很适合迁移到AI产品设计上。

你费尽心思给AI助手配了高精度的虚拟形象、流畅的对话UI,但用户还是觉得“这AI不靠谱”、“像个玩具”。问题出在哪?

用户对AI的第一印象,跟对人的第一印象一样:外貌(界面)占了70%的权重,但最终决定留下还是离开的,是交互中的确定性。而很多产品只做了外貌管理,却忽略了让用户“心里有底”。

现有方案的设计分析:好看不等于可信

目前主流做法分两类:

  1. 类人化外观路线(如数字人、拟人化头像):主打亲和力,但用户试用后普遍反馈“看着像人,一说话就崩”。比如某教育AI,3D建模精致,但回答小学题都有逻辑漏洞,反而加剧了不信任。
  2. 极简抽象路线(如Only text或几何图标):避免形象期待,但用户觉得冰冷,尤其是B2B场景,老板会觉得“连个像样的仪表盘都没有”。

问题不在外观,而在预期管理。Rachel Ward被批评外貌,是因为公众对她有“明星应该永远精致”的预期。而她的回应是在给自己重新定义标准。AI产品也需要主动管理用户预期,否则用户会拿自己已有的“AI应该无所不知”的幻觉来对比,怎么都是输。

产品决策逻辑:从“美颜”转向“可信度指标”

我在SaaS到AI转型中观察到:用户对AI的不信任,主要来自三个不可预测:

  • 能力边界不可预测:不知道它能做什么、不能做什么
  • 结果不可预测:同样的问题可能得到不同答案
  • 失败不可预测:出错了没有任何解释,直接崩或乱答

所以,产品决策的优先级应该是:

  1. 透明边界 > 全能人设:明确告诉用户“我能做X,不能做Y”,而不是暗示自己什么都懂。
  2. 可复现输出 > 花哨反应:相同输入得到稳定输出,比每次回复都“创意十足”更令人信服。
  3. 优雅失败 > 假装成功:当AI无法答复时,给出原因和替代方案,比硬给错误答案强100倍。

AI trust building design process

交互设计要点:4个可立即落地的检查点

1. 能力声明前置

在产品首次使用时,强制展示一段简短的能力说明书,比如:“我会帮你写代码、整理会议纪要,但我无法访问你的私人文件。” 这不是免责声明,而是降低用户预期,避免“为什么不能做”的抱怨。

2. 输出置信度可视化

像当年谷歌搜索结果数一样,给每句话一个置信度。例如文字加粗/颜色表示“高确定性”“推测”“需要验证”。某代码助手已经在用:稳定代码显示绿色,有潜在bug的显示黄色。用户一眼就知道哪里该审慎复查。

3. 失败时提供“为什么”和“怎么办”

当AI无法回答时,不要只显示“抱歉,我不能回答”。应该:

  • 说明原因(比如“超出已知范围”)
  • 给出替代方案(“是否尝试改写问题?或查看相关文档的链接”)
  • 让用户能反馈“这是错误的限制”,用于产品迭代

4. 可撤销与可解释

每一步操作都允许用户回退或查看推理过程。比如对话历史中点击AI的某句话,能弹出“我是基于以下数据得出的结论”的引用。这会让用户觉得AI“有据可查”,像Rachel Ward一样自信——因为自信来源于知道自己没有搞错。

可执行的改进建议

  1. 立刻去掉产品里的“万能”宣传语:改口为“专注解决XX场景的问题”,并上线一个“能力地图”页面。
  2. 在下一次更新中加入置信度标记:先针对高频错误场景做,比如计算类、事实类。
  3. 建立“失败模式设计评审”:每周花2小时,讨论用户最常见的前5个失败场景,设计对应的优雅反馈。
  4. A/B测试外观对留存的影响:不要凭直觉选虚拟人,对比“极简UI + 高可信度”和“拟真UI + 低可信度”的真实留存数据。我见过一个项目:去掉虚拟形象后,因性能提升和加载变快,用户次日留存反而上升了15%。

最后说回Rachel Ward:她不在意外貌批评,是因为她有更硬核的资本——她做的是再生农业,靠的是土壤数据而不是脸。你的AI产品也一样:把精力放在让用户“每次使用都心里有底”的设计上,用户的嘴自然会闭上。