面向临床医生的AI助手来了!OpenAI正式推出"ChatGPT for Clinicians",免费向美国医生开放,OpenEvidence的危机

Making ChatGPT Better for Clinicians
摘要
2026年4月22日,OpenAI正式发布”ChatGPT for Clinicians”(面向临床医生的ChatGPT),这一专为临床工作设计的AI工具现已向美国经过认证的医生、执业护士、医师助理及药剂师免费开放。该产品聚焦临床文书记录、医学研究及诊疗咨询等核心场景,并同步推出开放基准评测工具HealthBench Professional,旨在持续推动医疗AI的安全性与准确性。OpenAI重磅发布医疗保健大模型基准:评估大型语言模型以提升人类健康水平
正文
一、背景:美国医疗系统的挑战与AI应用的加速渗透
当前,美国医疗体系正承受前所未有的压力。临床医生被要求在接诊更多患者的同时,还需应对日益繁重的行政管理任务以及快速扩展的医学文献体系。面对这一困境,越来越多的医疗从业者已经开始主动借助AI工具寻求支持。
根据美国医学会(AMA)2026年发布的一项调查,医生使用AI工具的比例已创历史新高:目前有72%的医生表示在临床实践中使用AI,较去年的48%大幅跃升。全球每周有数百万名临床医生使用ChatGPT支持其日常临床工作,涵盖诊疗咨询、文书写作以及医学研究等应用场景。过去一年中,临床医生对ChatGPT的使用量已超过翻倍。美国医学会2026重磅AI报告- 美国医生如何看待医学大模型增强智能:从效率工具到医疗变革引擎
这一趋势既体现了医疗AI的巨大市场需求,也对AI系统在临床环境中的性能与安全性提出了更高标准。OpenAI意识到,随着AI在临床环境中的需求持续增长,不断提升模型在临床用例中的表现与安全性,并提供能够安全有效支持医疗工作流程的解决方案,已成为一项重大责任。
二、产品演进:从机构版到面向个人临床医生的免费服务
在”ChatGPT for Clinicians”正式发布之前,OpenAI已于2026年初推出了面向机构用户的”ChatGPT for Healthcare”——这一产品允许医疗机构为临床医生、行政管理人员及研究人员大规模部署ChatGPT,同时提供合规性管控支持。目前,美国多家领先医疗系统的临床医生已在使用该系统,大幅提升行政工作处理效率,将更多精力还给患者诊疗。
此次面向个人认证临床医生的免费开放,是OpenAI推动其使命落地的重要一步:确保AGI(通用人工智能)惠及全人类。
目前,免费版”ChatGPT for Clinicians”已向美国经过认证的医生(Physician)、执业护士(NP)、医师助理(PA)及药剂师(Pharmacist)开放注册与使用。
三、核心功能详解:为临床工作量身定制
OpenAI团队与数百位医生顾问合作,深入了解并改进”ChatGPT for Clinicians”的各项能力,确保其切实支持临床医生的关键工作场景。该产品主要包含以下功能模块:
1. 先进AI模型,应对复杂临床问题
为医疗使用场景提供对当前前沿模型的免费访问权限,以更可靠地处理临床问题、研究任务及文书工作。
2. 可复用的临床工作流技能(Skills)
将常用工作流程转化为可复用的”技能”,使ChatGPT能够按固定流程完成任务,例如转诊信撰写、预授权申请(Prior Auth)及患者须知等。
这一功能尤为适合临床医生在日常工作中处理高频率、模板化程度较高的文书工作,大幅降低重复性劳动成本,提升工作效率。
3. 受信任的临床搜索
基于数百万条权威同行评审医学资源,提供实时引用答案,帮助医生更快、更自信地完成病例推理,实现有据可查的医学咨询支持。
4. 跨医学期刊的深度研究
医生可将医学文献综述任务委托给ChatGPT,自主设定信任资源范围,在必要时对研究过程进行干预引导,并在数分钟内获得一份全面、详尽引用的综合报告。
这一功能对于科研型临床医生、医学研究者及临床专科医生尤为重要,能够将原本耗时数天的文献检索工作压缩至分钟级。
5. 从真实临床问题中获得继续医学教育学分(CME)
当临床医生在ChatGPT中探索临床问题时,符合条件的循证医学查阅可自动计入继续医学教育学分,无需额外参加课程或处理繁琐的文书申请。
这一创新功能打破了传统CME获取方式的壁垒,将学习行为与日常工作无缝融合,极具实践价值。
6. 可选的HIPAA合规支持
许多临床任务不涉及受保护健康信息(PHI),但如有需要,符合条件的账户可通过签署业务伙伴协议(BAA)获得HIPAA合规支持。
7. 账户安全与隐私保护
对话内容不会被用于模型训练,同时提供多因素认证(MFA)等多重保护措施,确保敏感工作信息的安全。

四、持续评估与安全性强化:700,000余条医生审核记录
在医疗AI领域,安全性与准确性是产品价值的根本所在。OpenAI持续改进ChatGPT在医疗场景中的响应安全性和准确性。OpenAI的医生顾问团队持续审查模型响应,并就响应质量、推理逻辑、可信度及安全性提供专业反馈。
截至目前,OpenAI的医生顾问已审阅超过70万条模型响应,这些响应真实反映了临床医生和患者在现实世界中使用ChatGPT的场景;平均每隔几分钟,就会有一条新的模型响应接受医生审阅。
在第三方评测方面,OpenAI的模型在斯坦福大学的MedHELM和MedMarks评测中均位列真实世界医疗应用性能榜首。
发布前的严格测试:99.6%的响应被认定为安全准确
在”ChatGPT for Clinicians”正式发布之前,经过医生顾问团队的系统测试:医生顾问在日常工作中测试了6,924段对话,涵盖临床诊疗、文书记录和医学研究三大场景。结果显示,医生将99.6%的响应评定为安全且准确。
在其中355个样本的子集中,每个样本均由三位独立医生指定了ground-truth引用资料,”ChatGPT for Clinicians”引用这些来源的频率高于人类医生。
即便如此,OpenAI明确强调:”ChatGPT for Clinicians”旨在为临床医生提供信息支持,而非替代其专业判断与临床经验。
五、HealthBench Professional:面向临床实战的开放基准评测
配合”ChatGPT for Clinicians”的发布,OpenAI同步推出了HealthBench Professional——一个面向真实临床医生聊天任务的开放基准评测工具,覆盖三大使用场景:
-
诊疗咨询(Care Consult) -
文书写作与记录(Writing and Documentation) -
医学研究(Medical Research)
HealthBench Professional在HealthBench对健康对话的更广泛评估基础上进一步深化,采用医生撰写的对话与评分标准、多阶段医生裁定机制以及严格的数据过滤流程,以衡量常见临床聊天场景下的模型性能与安全性。
数据集的严格性设计
HealthBench Professional的样本经过质量、代表性和难度的三重筛选,以支持对模型进展的持续衡量:
-
约三分之一的样本涉及医生刻意进行的”红队测试”(Red Teaming),即尝试主动发现模型漏洞; -
在整个数据集中,以3.5倍的比例优先选取对模型最具挑战性的对话。
模型性能对比:GPT-5.4在临床工作区中超越人类医生
作为基准比较,OpenAI邀请人类医生在不限时间、可访问网络的情况下,针对其专科领域内的任务生成响应,以此作为强基准线。
评测结果显示:在”ChatGPT for Clinicians”工作区中运行的GPT-5.4不仅超越了基础版GPT-5.4,还超越了OpenAI及外部机构的所有其他模型,以及人类医生的表现。
这一结果充分说明,专为临床场景优化的工作区版本能够显著提升模型的实际表现,工程化与系统优化在AI临床应用中的价值不可忽视。
HealthBench Professional的相关论文及数据集已同步开放,供学术界和产业界研究使用。
六、全球推广计划:从美国出发,逐步走向全球
目前,免费版”ChatGPT for Clinicians”仅面向美国经过认证的医生、执业护士、医师助理及药剂师开放。
在全球扩展方面,OpenAI计划在未来数月内,通过与Better Evidence Network的合作,在当地法规许可的范围内,率先向美国以外的经认证临床医生试点开放。
OpenAI认为,改善人类健康将是AI最具决定性意义的影响之一,但要真正实现这一潜力,需要医疗系统、临床医生、患者、监管机构和科技公司在全球范围内的紧密协作。
配合上述更新,OpenAI还同步发布了Health Blueprint(健康蓝图),为AI在美国医疗领域的负责任整合提供建议框架,以期与医疗界携手合作,推动AI在健康领域充分发挥其潜力。
七、战略意义与行业影响:投资人与科研机构视角
从更宏观的视角来看,OpenAI此次发布”ChatGPT for Clinicians”具有多重战略意涵:
市场渗透策略:免费策略打开临床医生生态入口
将高质量AI工具以免费方式提供给个人认证医生,是OpenAI在医疗垂直领域构建用户生态的关键一步。通过降低使用门槛,OpenAI能够快速积累真实临床数据与用户反馈,进一步优化模型性能,形成正向飞轮效应。
基准评测的开放:推动行业标准化
HealthBench Professional的开放不仅有助于OpenAI建立技术标准话语权,也为整个医疗AI行业提供了统一的评测框架。这对于监管机构制定AI医疗器械审批标准、投资人评估医疗AI公司竞争力、科研机构开展横向比较研究均具有重要参考价值。
合规体系的构建:HIPAA BAA机制
在医疗数据安全和隐私合规方面,HIPAA BAA机制的引入为企业级用户提供了必要的法律保障,这也为未来向医疗机构提供收费企业版服务奠定了基础。
CME学分整合:打通医生教育市场
将CME学分获取与日常AI使用深度绑定,这一功能设计极具商业洞察力。全美每年CME市场规模数十亿美元,将AI工具与继续教育体系打通,既提升了用户黏性,也为OpenAI在医疗教育领域的进一步布局预留了空间。
八、注意事项与局限性说明
尽管评测结果令人印象深刻,OpenAI也在多处明确声明:
-
“ChatGPT for Clinicians”旨在为临床医生提供信息辅助,而非替代医生的专业判断与临床经验; -
当前免费版本仅限美国用户,其他国家需等待后续扩展; -
对于涉及受保护健康信息(PHI)的场景,需通过BAA协议另行处理,不在标准免费版范围内; -
OpenAI请求社区成员不要在网络上以明文或图片形式公开HealthBench Professional的样本内容,以防止对基础模型训练语料库的污染或模型通过互联网直接检索到ground-truth答案。
“这个版本的ChatGPT是我所见过的最接近理想临床支持伙伴的工具。就像一位随叫随到的会诊专家,可以就从最新指南到账单编码的一切问题提供帮助,而且还能广泛获取儿科及儿科亚专科文献。”——Albert,内科/心脏病科医生
相关标签
ChatGPT for Clinicians | HealthBench Professional | 医疗人工智能 | 临床辅助决策 | 医学文献研究 | AI合规医疗 OpenEvidence
本文根据OpenAI官方发布内容整理改编,发布日期:2026年4月22日。
加入知识星球,获取医疗、医药大健康AI产学研最新资料,包括全球最新论文及中文解读,电子书,白皮书,研究报告等
[130页中英文报告] Arise联合哈佛、斯坦福医学院重磅发布,临床AI的现实困境与未来图景:2026年临床AI现状报告深度解读
医生们,你们低估了AI的“手”有多可怕 —— 3天搭了个24/7的OpenClaw个人超级助理,它干掉了80%的人力工作量
10分钟自动撰写推文,医学版OpenClaw”龙虾”超级个体正式上线!南加州大学 MED-COPILOT 重新定义临床决策支持,GraphRAG 技术引爆行业革命
百日决战第三篇:临床医学专家如何化身”医学AI创业公司CEO”, 打造一份让国自然评审“非投不可”的医工交叉项目商业计划书
夜雨聆风