AI的'听话'和"像人"之间,可能藏着一个根本性的trade-off。
The Decoder本周报道了一项大规模研究:研究人员对超过50款主流对话AI模型进行了系统性测评,发现一个反直觉的规律——
训练过程中越强调'乐于助人'的模型,在模拟人类行为测试中的表现越差。
这个发现在AI社区引发了关于对齐策略的新一轮讨论。
示意图(配图与文章内容无关)
01 '乐于助人'和"像人"为什么会冲突
研究人员给出的解释是:人类行为具有高度多样性和不一致性,而'乐于助人'的核心是提供正确、有用、符合预期的响应。
两者在训练目标上存在结构性冲突:模型被优化去"给答案",但"像人"恰恰需要的是"不总给答案"的那种模糊和矛盾。

示意图(配图与文章内容无关)
02 对AI产品设计意味着什么
如果这项研究结论成立,当前AI产品追求"更像人"的路线可能需要重新校准。
"更像人"和"更有用"可能不是同一件事:一个完美的助手和一个人类朋友,需要的是完全不同的能力集合。
AI公司需要在两者之间做出更明确的产品定位选择。
示意图(配图与文章内容无关)
🔥 今日互动
你希望AI更像助手,还是更像人?欢迎评论区聊聊。
A. 助手,解决问题更重要
B. 像人,交互体验更重要
C. 评论区见
---
本文由AI辅助创作,内容来源:The Decoder、大规模AI行为研究论文等。
夜雨聆风