
戳👆职场 > 点右上角 … > 设为星标🌟

人们通常认为,机器处理信息应该比人类更理性。但最新研究发现,适度引入人类的“认知偏差”,反而可能让AI变得更聪明、更便宜。
当前,大模型在完成预训练后,还需要经历“对齐”阶段,即通过反馈不断调整输出,使模型更安全、更准确、更符合人类需求。如今主流的对齐方式主要分为两类:一种是基于固定数据集的“离线对齐”,成本较低;另一种是模型边生成内容边接受反馈的“在线对齐”,效果更好,但训练成本极高。
研究人员发现,在线对齐之所以表现更强,一个关键原因在于,它无意间模仿了人类的认知方式。人类并不会完全理性地理解概率。基于这一发现,他们提出了用更低成本复制在线训练效果的方法。这一方法主要做了两项调整:第一,不再始终拿“旧模型”作为固定参照,而是不断更新参考模型,让其接近当前状态。第二,是所谓“非对称裁剪”,即对模型调整概率的幅度进行不均衡限制,让某些结果获得更高权重,从而模拟人类对概率的主观偏好。
实验结果显示,传统在线训练通常比离线训练强30%—60%。但加入人类的“认知偏差”后,离线方法不仅能接近在线训练效果,部分场景下训练速度还提升了6倍以上。这意味着未来AI训练不一定需要持续消耗巨额算力,通过更好理解人类认知机制,模型也许能以更低成本获得更强能力。这或许会让更多企业能够基于自身数据训练和更新专属AI模型,而不再只有少数巨头承担得起高昂训练费用。
作者芝加哥大学布斯商学院特约撰稿人Monika Brown
来源:《商学院》杂志2026年6月刊,编译:胡嘉琦


往期精选

巨头凌晨发通知:裁员8000人
DeepSeek痛失五名干将:人才的忠诚度,标好了价格

扫二维码 | 关注我们
帮助职场中的你 从聪明走向成功
版权声明:部分图源来自网络,版权归原作者所有。如有侵权联系删。“职场”所推送文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系方式:729116156@ qq.com 微信:lailai950517
我认真把你的每一个在看 都当成了喜欢

夜雨聆风