前几天听到两个很有意思的AI使用故事。
一个故事来自一位80多岁的老教授。
老教授一辈子做学问,见过无数新技术,也经历过从纸质病历、手写处方到电子系统的时代变化。按理说,面对新工具不该陌生。但第一次打开豆包聊天界面时,老教授还是有点紧张。
屏幕亮着,输入框空着。
老教授坐在桌前,看着那个等待提问的光标,半天没有打字。
旁边的人说:“可以随便问。”
老教授笑了笑,说:“不知道问什么。”
这句话很有代表性。
很多人以为,AI的门槛在于“会不会操作”。其实真正的门槛不在按钮、不在账号、不在界面,而在于:面对一个几乎什么都能聊的对象时,人反而不知道该从哪里开始。
后来,有人从老教授的兴趣切入。
老教授喜欢画画,于是建议先问AI几个和画画相关的问题:
“水墨画里的留白怎么理解?” “画山水画时,如何处理远山和近景的层次?” “初学者练习线条,有哪些方法?” “齐白石画虾为什么看起来简单却很有生命力?”
问题一问出去,AI很快给出回答。
老教授的眼神变了。
不是因为AI回答得多么惊天动地,而是因为那一刻,AI从一个“陌生的新技术”,变成了一个“可以聊画画的对象”。
这就是AI使用的第一个关键:不要从AI是什么开始,而要从使用者真正关心什么开始。
一、很多人不是不会用AI,而是不敢用AI
老教授的胆怯并不罕见。
不少医生、科研人员、药企研发人员第一次接触AI时,也会出现类似状态。
表面上看,是“不知道问什么”。深层看,是几种心理交织在一起:
1. 怕问得太简单,显得外行
很多高知群体尤其明显。
面对AI时,反而会产生一种奇怪的心理负担:如果问一个很基础的问题,会不会显得不专业?
但AI不是同行评审,也不是学术答辩委员会。AI更像一个随时待命的草稿助手、讨论对象、资料整理员。问题越具体,AI越容易发挥作用。
2. 怕AI回答太离谱,浪费时间
这种担心也很真实。
尤其在医学、药物研发、临床研究领域,错误信息不是小问题。一个错误剂量、一个错误适应症、一个错误入排标准,都可能带来严重后果。
因此,专业人士对AI保持警惕完全合理。
3. 怕自己驾驭不了AI
不少人内心真正担心的不是AI能力弱,而是自己无法判断AI什么时候靠谱、什么时候胡说。
这恰恰触及AI应用的核心:AI时代最重要的能力,不是会不会提问,而是会不会判断。
二、院长为什么觉得AI“不好用”?
另一个故事来自一位医院院长。
院长尝试使用AI后,反馈并不积极。
大致意思是:AI生成内容看起来像那么回事,但不敢直接用。每次AI给出答案后,还需要人工重新核查。这样一来,本来希望节省时间,结果反而多了一道工序。
这很像老司机第一次体验自动驾驶。
车道保持、自动跟车、辅助变道,看起来都很高级。但老司机坐在驾驶位上,脚不敢离刹车,手不敢离方向盘,眼睛死死盯着路面。
原因很简单:老司机太懂驾驶,更知道驾驶中哪些地方容易出事。
同样,医院院长不是不懂管理,反而因为懂医院运行、懂医疗风险、懂政策边界,所以更容易看到AI输出中的隐患。
比如AI写一份医院制度,看起来条理清楚,语言规范,甚至还分了“一、二、三、四”。但院长一看就知道:
有些表述不符合医院实际流程; 有些要求缺少上级政策依据; 有些措辞可能引发执行歧义; 有些内容看似正确,实际不可落地。
这类问题,非专业人员很难看出来。
所以,院长觉得AI“不好用”,未必说明AI没有价值,而是说明AI还没有被放到合适的位置。
三、AI当前最真实的能力边界
关于AI,有两种极端看法。
一种认为AI无所不能,很快取代医生、科研人员、管理者。
另一种认为AI不过是“高级搜索引擎”,经常胡编乱造,不值得投入精力。
这两种看法都过于简单。
更接近现实的判断是:
在多数通用场景下,AI能力已经超过普通人;但在非常专业、非常细分、强责任边界的场景下,AI仍然不如真正的专业从业者。
举几个例子。
让AI写一篇科普文章、总结一份会议纪要、润色一段英文邮件、整理一份学习计划、设计一张表格,效果通常不错,甚至比很多人做得更快、更清楚。
但如果让AI判断某个复杂病例的治疗方案、设计关键注册临床试验的主要终点、解释某个罕见不良事件与药物因果关系、撰写用于监管递交的关键医学论证,就不能把AI当作最终决策者。
因为这些任务不是“文字生成任务”,而是“专业判断任务”。
AI可以帮忙提供思路、搭建框架、列出风险点、补充背景资料,但最终判断仍然要依靠专业人员。
这就像医学影像AI可以辅助读片,但不能简单等同于放射科主任;药物警戒系统可以筛查信号,但不能替代医学评估;统计软件可以算出P值,但不能替代临床意义判断。
四、真正决定AI效果的,不是AI,而是使用者
很多人用AI效果不好,常常归因于“AI不行”。
但在实际使用中,同一个AI工具,不同人使用,结果差异非常大。
差异主要来自三个方面。
1. 是否能给AI清晰角色
比如直接问:
“帮我写一份临床研究方案。”
这个问题太宽,AI只能给出泛泛而谈的内容。
如果换成:
“请作为肿瘤新药临床研究医生,帮忙设计一项针对晚期NSCLC二线治疗的II期单臂研究方案框架,重点包括研究目的、主要终点、关键入排标准、安全性监测和统计学考虑。内容用于内部讨论,不作为正式递交文件。”
AI输出质量会明显不同。
角色、疾病领域、研究阶段、适应证、使用目的、输出范围越清楚,结果越接近可用。
2. 是否能设置边界
医学领域使用AI,边界比能力更重要。
应明确告诉AI:
不确定内容必须标注; 不得编造指南、文献和数据; 涉及剂量、适应证、禁忌证必须提醒核查来源; 输出只用于草稿或讨论,不作为最终医学决策; 必须列出潜在风险和需要人工确认的部分。
没有边界的AI,就像没有栏杆的楼梯,看起来能走,但容易踩空。
3. 是否具备专业判断力
AI最危险的地方,不是明显错误,而是“看起来很对的错误”。
医学写作中,这种情况尤其常见。
一段话语言流畅、逻辑整齐、术语丰富,很容易让非专业使用者产生信任感。但专业人士可能一眼看出其中存在概念偷换、证据等级不足、指南版本过旧、适用人群错误等问题。
所以,AI在专业领域的价值并不是降低专业门槛,而是放大专业能力。
会用的人,效率提升非常明显;不会用的人,可能只是更快地产生一堆需要返工的内容。
五、现在处于“驯化AI”的阶段
当前AI还没有完全固化进标准化工作流程。
很多医院、药企、科研团队都在试用AI,但大多仍处于探索期:哪些工作可以交给AI?哪些必须人工完成?哪些内容可以直接复用?哪些内容必须严格审核?这些问题还没有形成统一答案。
因此,现阶段最重要的能力可以概括为一个词:驯化AI,也就是英文里常说的 harness AI。
“驯化”不是把AI当成宠物,而是像驯马一样,知道什么时候放开速度,什么时候拉住缰绳。
在通用任务中,可以让AI跑得快一点:
初稿撰写; 文献摘要; 会议纪要; 科普内容; 英文润色; 培训材料; 头脑风暴。
在专业高风险任务中,必须拉紧缰绳:
临床决策; 药物剂量; 适应证判断; 方案关键设计; 医学监查结论; 监管递交材料; 安全性风险评估。
真正成熟的AI使用者,不是迷信AI,也不是拒绝AI,而是知道:哪些任务可以让AI先跑,哪些任务必须人来定。
六、给医学和药物研发人员的三个建议
建议一:从低风险、高频次任务开始
不要一上来就让AI做最复杂、最关键的事情。
可以先从这些任务练手:
整理会议纪要; 改写科普文章; 总结英文文献; 设计培训提纲; 优化PPT结构; 梳理项目沟通邮件。
这些场景风险较低、反馈及时,最适合建立手感。
建议二:把AI当成“实习生”,不是“专家委员会”
对AI最合适的期待是:聪明、勤快、知识面广,但需要监督。
给任务要清楚,交付后要检查,发现问题要反馈,必要时要求重写。
比如可以这样追问:
“哪些内容可能不准确?” “请列出需要人工核查的关键点。” “请用更符合临床研究医生表达习惯的方式重写。” “请把推测性内容和有依据内容分开。” “请指出这个方案设计中可能被伦理委员会质疑的地方。”
这种互动越多,AI越有价值。
建议三:建立团队级AI使用规范
个人会用AI,只是第一步。
医院和药企更需要建立组织层面的规则:
哪些数据不能输入AI; 哪些任务允许使用AI; 哪些输出必须人工复核; 哪些场景需要留痕; 如何处理患者隐私和商业机密; 如何评估AI生成内容质量。
没有规范,AI使用就会变成个人习惯;有了规范,AI才可能真正进入工作流。
结语:AI不会自动带来效率,正确使用AI才会
80多岁的老教授第一次面对AI时,不知道该说什么。
医院院长第一次使用AI后,觉得还得人工核查,并没有省时间。
这两个故事放在一起,正好说明AI落地的真实处境。
AI不是打开就能改变一切的魔法工具。AI更像一匹速度很快、耐力很强、但还需要缰绳和骑手的马。
对于普通人,第一步是敢于开口,从真正感兴趣的问题问起。
对于专业人士,第一步不是盲目相信,而是学会设定规则、边界和验证机制。
未来,人与AI的差距,可能不在于谁有没有AI,而在于谁更会驾驭AI。
医学和新药研发领域尤其如此。
真正值得培养的,不是“会聊天”的能力,而是三种能力:提出好问题、设置好边界、做出好判断。
掌握这三点,AI才不是负担,而会成为专业能力的加速器。
推荐阅读
PS: 我的新书《AI赋能医生》,对于学医的人来说,这是一本非常好的AI入门和实操指南,被清华大学出版社评价为"AI时代医者必读书目"。
本书特点
传授的技巧和思路,适用于 ChatGPT、DeepSeek、Gemini、元宝、豆包 等所有主流AI 即使不是学医的人,书中关于AI应用的基本原则也很有启发性 如果你有医生朋友,赠送这本书将非常有价值
即使不是学医的人,书中关于AI应用的基本原则也很有启发性 如果你有医生朋友,赠送这本书将非常有价值 购书优惠

夜雨聆风