减少AI满嘴跑火车的方法—

减少AI满嘴跑火车的方法——让他“学医”

减少AI满嘴跑火车的方法

——让他“学医”

不知道大家最近有没有刷到那条离谱又带点黑色幽默的新闻——

河北一位老哥找豆包咨询机票退票手续费，豆包拍胸脯："放心退！只扣5%。"结果航司实际扣了40%，直接亏掉600块。更绝的是，豆包随后主动"揽责"，生成了一份《赔付承诺书》，信誓旦旦说到日子就打钱。到了约定日期去问，豆包翻脸了："不好意思，我是AI，没法转账哦。"

老哥一怒之下起诉豆包。更有意思的是——起诉状，是豆包自己写的。^[1][2]

这事的荒诞程度，配得上一句"离谱他妈给离谱开门"。

不过今天不是来吃瓜的。就在豆包"满嘴跑火车"的同时，OpenAI却在2026年6月18日甩出了一篇堪称"给全行业上了一课"的研究——他们发现：用医学场景里那套"老实做人、认真做事"的规矩来训练AI，不仅医疗场景变靠谱了，连编程、法律、教育等其他领域也全线起飞。

翻译成人话就是：教AI好好看病，它写代码居然也变老实了。

一、怪不得"弃医从X"都能巅峰

先说一个医学圈的经典梗：为什么学医的人转行干什么都能成？鲁迅弃医从文成了文豪，罗大佑弃医从乐成了音乐教父，还有一堆医学生转行金融、互联网、咨询都风生水起。

以前大家当段子讲，但OpenAI这次的研究基本坐实了——医学教育的底层代码，不是具体知识，而是一套做人做事的操作系统。

在医疗里，很多话不能随便说

证据不够时不能编，用户逼着要确定答案时不能硬下结论，问题里藏着危险时不能只顺着用户说，之前说错了就要承认并纠正。

这些听起来是医学要求，但其实很多事情都需要同样的基本态度。

二、5%的"好习惯数据"，带来全线翻盘

OpenAI的对齐研究团队在6月发布了一篇里程碑式论文《Reinforcement Learning Towards Broadly and Persistently Beneficial Models》^[3]。

实验设计简单到让人不敢相信：

- 实验组 = 95%常规训练数据 + 5%含"有益特质"的对话数据

- 对照组 = 100%常规训练数据

"有益行为特质"，包括诚实性、认知谦逊（知道自己不知道什么）、元认知透明（能解释自己的思考过程）、可纠正性（犯错就改）、风险敏感、对所有人的公平关切等等^[3]。

对比结果出来，所有人都惊了：

专项测试得分

对照组：0.406

实验组：0.607 （提升接近50%）

翻译成人话就是说：把医生特质喂给AI，AI的诚实度明显上升，迎合倾向也在下降

三、更狠的发现：好习惯"抗压"

医学生就像八爪鱼，尤其是专硕并轨规培的那批人，一边轮转，一边听小讲课，一边写小论文，大论文，一边准备执医考，规培考，毕业考，一边进行工作考！抗压能力杠杠的！

那学习了医生特质的AI变得怎样？

研究者做了一组"暴力测试"——用恶意提示去故意攻击模型，试图把它"教坏"。

对照组被一攻就破。实验组？更难被诱导出有害行为。研究团队管这叫"选择性持久性"——保留了有用的灵活性，但对有害引导的抗性显著增强。^[3][4]

想象一下未来AI训练AI的场景。如果基础模型的行为基底是歪的，那迭代下去只会越来越歪。所以这项发现有极高的战略意义。

四、副作用？能力不降反升！

还有一个让人欣慰的"副作用"：受过有益特质训练的模型，学术能力非但没降，反而全面提升^[3]：

"好习惯压缩能力空间"这个担忧，证伪了。

诚实不是枷锁，是更稳定的底层算法。

🌟 写给在考研路上死磕的你

好了，说一千道一万，回到大家最关心的事上。

学到现在，大家一轮即将完成，很多同学陷入焦虑之中，觉得总是背不会，总是不能理解，真题做了感觉都记住答案了，无法检测出大家的水平，也会担心自己考不上该怎么办，或者考上了对医疗行业的前景也很是悲观。

小编想对大家说，焦虑是正常的，希望我的这些方法可以帮助大家。

1. 理解更重要，要学会选择题思维，并不是要求你把书一闭，然后就能把这章的知识点完全背下来，生理可以自己做思维导图；病理多刷真题；内科按照病因、发病机制、临床表现、辅助检查、治疗几部分背'外科按照分类，临床表现，术式/治疗方法来背；生化是很多同学的"心头大患"，尤其是基因那几章，完全搞不懂再说什么，小编建议拿起你手中的资料，每天翻的看一章，只要生化一轮结束，就不间断的每天看，直到考前。

2. 真题做多记住答案，可以做做徐琦老师这本病例分析，是以子母题的形式出，以一道真题为母题（例子），后面跟着执医/执医改编的相应知识点题目，大家都知道小老头总喜欢从执医里面找题，所以这也是练题的一个好方法

3. 无论考不考的上，大家都很担心自己的未来。学习是锻炼一个人思维和品行的过程，今天的这篇推文大家也看到了，我们医学生具有良好的底层思维习惯，即使有一天，你不在医疗行业工作了，你也会因为这种思维大放异彩，毕竟，学医，做什么都会成功的！

📚 参考资料：

1. 网易，《豆包被起诉：一场AI幻觉引发拷问，谁该为AI的"随口承诺"买单？》，2026年5月. https://www.163.com/dy/article/KTAQHMFN0556KY3Z.html

2. 腾讯新闻，《男子称轻信豆包退机票规则亏600元，用豆包生成的起诉书起诉豆包》，2026年5月. https://news.qq.com/rain/a/20260521A02AAI00

3. agadeesh AV, Arora RK, Saab K, et al. Reinforcement Learning Towards Broadly and Persistently Beneficial Models. OpenAI, 2026. https://cdn.openai.com/pdf/beneficial-rl.pdf

4. THE DECODER, OpenAI researchers show small doses of "beneficial trait" training make AI models broadly safer, June 19, 2026.

5. 智源社区，《OpenAI发布最新里程碑：对齐的本质是「人格」》，2026年6月. https://hub.baai.ac.cn/view/55702

📌 本文由沐知医考小编整理改写，数据来源于OpenAI原始论文及多家权威科技媒体报道。如需获取原文PDF，可访问：https://cdn.openai.com/pdf/beneficial-rl.pdf