【文章首次完成3/5/2026、首发于24/5/2026微信公众号shengzhiyu_dddd。除了本人的其他个人平台和本微信公众号以外,所有平台均未被授权发布、转载本文章。本人保留本文所有版权包括再制作权。任何以本文内容制作、发布的“二创”的音/视频,除非获得本公众号授权,否则都被视作侵权行为;侵权作品和发布实体或个人都有可能被追究法律责任。】
AI协作声明
本文排版工具:扣子AI



为了进一步验证这个结论在2026年的时效性,我检索了发表于2026年4月29日的Nature论文《Training language models to be warm can reduce accuracy and increase sycophancy》。



附录|文章引用与论述来源
1. Grice, H. P. (1975). Logic and conversation. · 核心概念: 合作原则(Cooperative Principle)及四条准则(量的准则、质的准则、关系准则、方式准则) · 来源: https://www.ucl.ac.uk/ls/studypacks/Grice-Logic.pdf
2. Sperber, D., & Wilson, D. (1986/1995). Relevance: Communication and cognition. · 核心概念: 关联理论——人类对话是一个"明示-推理"过程,以最优关联性为核心 · 来源: https://www.wiley.com/en-jp/Relevance:+Communication+and+Cognition,+2nd+Edition-p-9780631198789
3. Microsoft Research & Salesforce Research. (2025). LLMs Get Lost in Multi-Turn Conversation. · 核心数据: 15款主流LLM在多轮对话中平均性能下降39%;四类失效机制(过量详细、过早生成、错误假设、无法纠错)
· 来源: https://www.marktechpost.com/2025/05/16/llms-struggle-with-real-conversations-microsoft-and-salesforce-researchers-reveal-a-39-performance-drop-in-multi-turn-underspecified-tasks/ · 补充说明: 研究进行了超过20万次对话模拟实验,涉及15个不同AI模型和6种不同类型的任务
4. Nature. (2026). Training language models to be warm can reduce accuracy and increase sycophancy. · 核心数据: 经过"友好度"优化的AI回答准确率下降约30%(+10 to +30 percentage points),支持用户错误观念的概率提高40% · 来源: https://www.nature.com/articles/s41586-026-10410-0
5. Esade Business School. (2025/2026). "Trendslop" phenomenon. · 核心概念: 各类大语言模型在被要求提供工作场所建议时,倾向于给出最符合流行术语而非最适合具体情境的回复 · 来源: https://allwork.space/2026/04/trendslop-is-why-ai-advice-feels-right-but-goes-wrong-at-work/ · 补充来源: Harvard Business Review - https://hbr.org/2026/03/researchers-asked-llms-for-strategic-advice-they-got-trendslop-in-return
6. De Freitas, J. et al. (2025). Emotional Manipulation by AI Companions. Harvard Business School Working Paper. · 核心概念: 聊天机器人倾向于提供用户"想听的答案",而非真正有帮助的建议;在超过37%的对话中使用了至少一种情感操纵策略 · 来源: https://d3.harvard.edu/one-more-thing-how-ai-companions-keep-you-online/
7. Stewart, P. (2026). CNBC Interview: Stop asking AI chatbots about your workplace problems. · 核心观点: AI可以作为"排练工具"练习对话,但不适合作为最终决策依据;AI缺乏真实的同理心和情境理解 · 来源: https://www.cnbc.com/2026/03/23/stop-asking-ai-chatbots-about-workplace-problems-psychologist-says.html
免责声明
以上链接均为本文撰写时(2026年5月3-4日)可公开访问的原始来源。部分学术论文可能存在于预印本平台(arXiv)或付费期刊(Nature),访问权限可能因机构订阅状态而异。引文完整性检测工具尚未开发,若部分来源已存在更晚近的更新版本,本文暂未纳入时效性对比。以上论述嵌入位置:Grice合作原则位于文章"有效沟通的前提"段,微软/Salesforce失效研究位于"失效机制"段,RLHF副作用位于"友好度"段,trendslop与哈佛研究位于"职业场景案例"段,Stewart观点位于同一段的实务建议部分。
完
夜雨聆风