AI不是“神助手”,更像一匹还没套好缰绳的快马

前几天听到两个很有意思的AI使用故事。

一个故事来自一位80多岁的老教授。

老教授一辈子做学问，见过无数新技术，也经历过从纸质病历、手写处方到电子系统的时代变化。按理说，面对新工具不该陌生。但第一次打开豆包聊天界面时，老教授还是有点紧张。

屏幕亮着，输入框空着。

老教授坐在桌前，看着那个等待提问的光标，半天没有打字。

旁边的人说：“可以随便问。”

老教授笑了笑，说：“不知道问什么。”

这句话很有代表性。

很多人以为，AI的门槛在于“会不会操作”。其实真正的门槛不在按钮、不在账号、不在界面，而在于：面对一个几乎什么都能聊的对象时，人反而不知道该从哪里开始。

后来，有人从老教授的兴趣切入。

老教授喜欢画画，于是建议先问AI几个和画画相关的问题：

“水墨画里的留白怎么理解？”
“画山水画时，如何处理远山和近景的层次？”
“初学者练习线条，有哪些方法？”
“齐白石画虾为什么看起来简单却很有生命力？”

问题一问出去，AI很快给出回答。

老教授的眼神变了。

不是因为AI回答得多么惊天动地，而是因为那一刻，AI从一个“陌生的新技术”，变成了一个“可以聊画画的对象”。

这就是AI使用的第一个关键：不要从AI是什么开始，而要从使用者真正关心什么开始。

一、很多人不是不会用AI，而是不敢用AI

老教授的胆怯并不罕见。

不少医生、科研人员、药企研发人员第一次接触AI时，也会出现类似状态。

表面上看，是“不知道问什么”。深层看，是几种心理交织在一起：

1. 怕问得太简单，显得外行

很多高知群体尤其明显。

面对AI时，反而会产生一种奇怪的心理负担：如果问一个很基础的问题，会不会显得不专业？

但AI不是同行评审，也不是学术答辩委员会。AI更像一个随时待命的草稿助手、讨论对象、资料整理员。问题越具体，AI越容易发挥作用。

2. 怕AI回答太离谱，浪费时间

这种担心也很真实。

尤其在医学、药物研发、临床研究领域，错误信息不是小问题。一个错误剂量、一个错误适应症、一个错误入排标准，都可能带来严重后果。

因此，专业人士对AI保持警惕完全合理。

3. 怕自己驾驭不了AI

不少人内心真正担心的不是AI能力弱，而是自己无法判断AI什么时候靠谱、什么时候胡说。

这恰恰触及AI应用的核心：AI时代最重要的能力，不是会不会提问，而是会不会判断。

二、院长为什么觉得AI“不好用”？

另一个故事来自一位医院院长。

院长尝试使用AI后，反馈并不积极。

大致意思是：AI生成内容看起来像那么回事，但不敢直接用。每次AI给出答案后，还需要人工重新核查。这样一来，本来希望节省时间，结果反而多了一道工序。

这很像老司机第一次体验自动驾驶。

车道保持、自动跟车、辅助变道，看起来都很高级。但老司机坐在驾驶位上，脚不敢离刹车，手不敢离方向盘，眼睛死死盯着路面。

原因很简单：老司机太懂驾驶，更知道驾驶中哪些地方容易出事。

同样，医院院长不是不懂管理，反而因为懂医院运行、懂医疗风险、懂政策边界，所以更容易看到AI输出中的隐患。

比如AI写一份医院制度，看起来条理清楚，语言规范，甚至还分了“一、二、三、四”。但院长一看就知道：

有些表述不符合医院实际流程；
有些要求缺少上级政策依据；
有些措辞可能引发执行歧义；
有些内容看似正确，实际不可落地。

这类问题，非专业人员很难看出来。

所以，院长觉得AI“不好用”，未必说明AI没有价值，而是说明AI还没有被放到合适的位置。

三、AI当前最真实的能力边界

关于AI，有两种极端看法。

一种认为AI无所不能，很快取代医生、科研人员、管理者。

另一种认为AI不过是“高级搜索引擎”，经常胡编乱造，不值得投入精力。

这两种看法都过于简单。

更接近现实的判断是：

在多数通用场景下，AI能力已经超过普通人；但在非常专业、非常细分、强责任边界的场景下，AI仍然不如真正的专业从业者。

举几个例子。

让AI写一篇科普文章、总结一份会议纪要、润色一段英文邮件、整理一份学习计划、设计一张表格，效果通常不错，甚至比很多人做得更快、更清楚。

但如果让AI判断某个复杂病例的治疗方案、设计关键注册临床试验的主要终点、解释某个罕见不良事件与药物因果关系、撰写用于监管递交的关键医学论证，就不能把AI当作最终决策者。

因为这些任务不是“文字生成任务”，而是“专业判断任务”。

AI可以帮忙提供思路、搭建框架、列出风险点、补充背景资料，但最终判断仍然要依靠专业人员。

这就像医学影像AI可以辅助读片，但不能简单等同于放射科主任；药物警戒系统可以筛查信号，但不能替代医学评估；统计软件可以算出P值，但不能替代临床意义判断。

四、真正决定AI效果的，不是AI，而是使用者

很多人用AI效果不好，常常归因于“AI不行”。

但在实际使用中，同一个AI工具，不同人使用，结果差异非常大。

差异主要来自三个方面。

1. 是否能给AI清晰角色

比如直接问：

“帮我写一份临床研究方案。”

这个问题太宽，AI只能给出泛泛而谈的内容。

如果换成：

“请作为肿瘤新药临床研究医生，帮忙设计一项针对晚期NSCLC二线治疗的II期单臂研究方案框架，重点包括研究目的、主要终点、关键入排标准、安全性监测和统计学考虑。内容用于内部讨论，不作为正式递交文件。”

AI输出质量会明显不同。

角色、疾病领域、研究阶段、适应证、使用目的、输出范围越清楚，结果越接近可用。

2. 是否能设置边界

医学领域使用AI，边界比能力更重要。

应明确告诉AI：

不确定内容必须标注；
不得编造指南、文献和数据；
涉及剂量、适应证、禁忌证必须提醒核查来源；
输出只用于草稿或讨论，不作为最终医学决策；
必须列出潜在风险和需要人工确认的部分。

没有边界的AI，就像没有栏杆的楼梯，看起来能走，但容易踩空。

3. 是否具备专业判断力

AI最危险的地方，不是明显错误，而是“看起来很对的错误”。

医学写作中，这种情况尤其常见。

一段话语言流畅、逻辑整齐、术语丰富，很容易让非专业使用者产生信任感。但专业人士可能一眼看出其中存在概念偷换、证据等级不足、指南版本过旧、适用人群错误等问题。

所以，AI在专业领域的价值并不是降低专业门槛，而是放大专业能力。

会用的人，效率提升非常明显；不会用的人，可能只是更快地产生一堆需要返工的内容。

五、现在处于“驯化AI”的阶段

当前AI还没有完全固化进标准化工作流程。

很多医院、药企、科研团队都在试用AI，但大多仍处于探索期：哪些工作可以交给AI？哪些必须人工完成？哪些内容可以直接复用？哪些内容必须严格审核？这些问题还没有形成统一答案。

因此，现阶段最重要的能力可以概括为一个词：驯化AI，也就是英文里常说的 harness AI。

“驯化”不是把AI当成宠物，而是像驯马一样，知道什么时候放开速度，什么时候拉住缰绳。

在通用任务中，可以让AI跑得快一点：

初稿撰写；
文献摘要；
会议纪要；
科普内容；
英文润色；
培训材料；
头脑风暴。

在专业高风险任务中，必须拉紧缰绳：

临床决策；
药物剂量；
适应证判断；
方案关键设计；
医学监查结论；
监管递交材料；
安全性风险评估。

真正成熟的AI使用者，不是迷信AI，也不是拒绝AI，而是知道：哪些任务可以让AI先跑，哪些任务必须人来定。

六、给医学和药物研发人员的三个建议

建议一：从低风险、高频次任务开始

不要一上来就让AI做最复杂、最关键的事情。

可以先从这些任务练手：

整理会议纪要；
改写科普文章；
总结英文文献；
设计培训提纲；
优化PPT结构；
梳理项目沟通邮件。

这些场景风险较低、反馈及时，最适合建立手感。

建议二：把AI当成“实习生”，不是“专家委员会”

对AI最合适的期待是：聪明、勤快、知识面广，但需要监督。

给任务要清楚，交付后要检查，发现问题要反馈，必要时要求重写。

比如可以这样追问：

“哪些内容可能不准确？”
“请列出需要人工核查的关键点。”
“请用更符合临床研究医生表达习惯的方式重写。”
“请把推测性内容和有依据内容分开。”
“请指出这个方案设计中可能被伦理委员会质疑的地方。”

这种互动越多，AI越有价值。

建议三：建立团队级AI使用规范

个人会用AI，只是第一步。

医院和药企更需要建立组织层面的规则：

哪些数据不能输入AI；
哪些任务允许使用AI；
哪些输出必须人工复核；
哪些场景需要留痕；
如何处理患者隐私和商业机密；
如何评估AI生成内容质量。

没有规范，AI使用就会变成个人习惯；有了规范，AI才可能真正进入工作流。

结语：AI不会自动带来效率，正确使用AI才会

80多岁的老教授第一次面对AI时，不知道该说什么。

医院院长第一次使用AI后，觉得还得人工核查，并没有省时间。

这两个故事放在一起，正好说明AI落地的真实处境。

AI不是打开就能改变一切的魔法工具。AI更像一匹速度很快、耐力很强、但还需要缰绳和骑手的马。

对于普通人，第一步是敢于开口，从真正感兴趣的问题问起。

对于专业人士，第一步不是盲目相信，而是学会设定规则、边界和验证机制。

未来，人与AI的差距，可能不在于谁有没有AI，而在于谁更会驾驭AI。

医学和新药研发领域尤其如此。

真正值得培养的，不是“会聊天”的能力，而是三种能力：提出好问题、设置好边界、做出好判断。

掌握这三点，AI才不是负担，而会成为专业能力的加速器。