面向临床医生的AI助手来了!OpenAI正式推出＂ChatGPT for Clinicians＂,免费向美国医生开放,OpenEvidence的危机-夜雨聆风

面向临床医生的AI助手来了!OpenAI正式推出＂ChatGPT for Clinicians＂,免费向美国医生开放,OpenEvidence的危机

Making ChatGPT Better for Clinicians

摘要

2026年4月22日，OpenAI正式发布”ChatGPT for Clinicians”（面向临床医生的ChatGPT），这一专为临床工作设计的AI工具现已向美国经过认证的医生、执业护士、医师助理及药剂师免费开放。该产品聚焦临床文书记录、医学研究及诊疗咨询等核心场景，并同步推出开放基准评测工具HealthBench Professional，旨在持续推动医疗AI的安全性与准确性。OpenAI重磅发布医疗保健大模型基准：评估大型语言模型以提升人类健康水平

正文

一、背景：美国医疗系统的挑战与AI应用的加速渗透

当前，美国医疗体系正承受前所未有的压力。临床医生被要求在接诊更多患者的同时，还需应对日益繁重的行政管理任务以及快速扩展的医学文献体系。面对这一困境，越来越多的医疗从业者已经开始主动借助AI工具寻求支持。

根据美国医学会（AMA）2026年发布的一项调查，医生使用AI工具的比例已创历史新高：目前有72%的医生表示在临床实践中使用AI，较去年的48%大幅跃升。全球每周有数百万名临床医生使用ChatGPT支持其日常临床工作，涵盖诊疗咨询、文书写作以及医学研究等应用场景。过去一年中，临床医生对ChatGPT的使用量已超过翻倍。美国医学会2026重磅AI报告- 美国医生如何看待医学大模型增强智能：从效率工具到医疗变革引擎

这一趋势既体现了医疗AI的巨大市场需求，也对AI系统在临床环境中的性能与安全性提出了更高标准。OpenAI意识到，随着AI在临床环境中的需求持续增长，不断提升模型在临床用例中的表现与安全性，并提供能够安全有效支持医疗工作流程的解决方案，已成为一项重大责任。

二、产品演进：从机构版到面向个人临床医生的免费服务

在”ChatGPT for Clinicians”正式发布之前，OpenAI已于2026年初推出了面向机构用户的”ChatGPT for Healthcare”——这一产品允许医疗机构为临床医生、行政管理人员及研究人员大规模部署ChatGPT，同时提供合规性管控支持。目前，美国多家领先医疗系统的临床医生已在使用该系统，大幅提升行政工作处理效率，将更多精力还给患者诊疗。

此次面向个人认证临床医生的免费开放，是OpenAI推动其使命落地的重要一步：确保AGI（通用人工智能）惠及全人类。

目前，免费版”ChatGPT for Clinicians”已向美国经过认证的医生（Physician）、执业护士（NP）、医师助理（PA）及药剂师（Pharmacist）开放注册与使用。

三、核心功能详解：为临床工作量身定制

OpenAI团队与数百位医生顾问合作，深入了解并改进”ChatGPT for Clinicians”的各项能力，确保其切实支持临床医生的关键工作场景。该产品主要包含以下功能模块：

1. 先进AI模型，应对复杂临床问题

为医疗使用场景提供对当前前沿模型的免费访问权限，以更可靠地处理临床问题、研究任务及文书工作。

2. 可复用的临床工作流技能（Skills）

将常用工作流程转化为可复用的”技能”，使ChatGPT能够按固定流程完成任务，例如转诊信撰写、预授权申请（Prior Auth）及患者须知等。

这一功能尤为适合临床医生在日常工作中处理高频率、模板化程度较高的文书工作，大幅降低重复性劳动成本，提升工作效率。

3. 受信任的临床搜索

基于数百万条权威同行评审医学资源，提供实时引用答案，帮助医生更快、更自信地完成病例推理，实现有据可查的医学咨询支持。

4. 跨医学期刊的深度研究

医生可将医学文献综述任务委托给ChatGPT，自主设定信任资源范围，在必要时对研究过程进行干预引导，并在数分钟内获得一份全面、详尽引用的综合报告。

这一功能对于科研型临床医生、医学研究者及临床专科医生尤为重要，能够将原本耗时数天的文献检索工作压缩至分钟级。

5. 从真实临床问题中获得继续医学教育学分（CME）

当临床医生在ChatGPT中探索临床问题时，符合条件的循证医学查阅可自动计入继续医学教育学分，无需额外参加课程或处理繁琐的文书申请。

这一创新功能打破了传统CME获取方式的壁垒，将学习行为与日常工作无缝融合，极具实践价值。

6. 可选的HIPAA合规支持

许多临床任务不涉及受保护健康信息（PHI），但如有需要，符合条件的账户可通过签署业务伙伴协议（BAA）获得HIPAA合规支持。

7. 账户安全与隐私保护

对话内容不会被用于模型训练，同时提供多因素认证（MFA）等多重保护措施，确保敏感工作信息的安全。

四、持续评估与安全性强化：700,000余条医生审核记录

在医疗AI领域，安全性与准确性是产品价值的根本所在。OpenAI持续改进ChatGPT在医疗场景中的响应安全性和准确性。OpenAI的医生顾问团队持续审查模型响应，并就响应质量、推理逻辑、可信度及安全性提供专业反馈。

截至目前，OpenAI的医生顾问已审阅超过70万条模型响应，这些响应真实反映了临床医生和患者在现实世界中使用ChatGPT的场景；平均每隔几分钟，就会有一条新的模型响应接受医生审阅。

在第三方评测方面，OpenAI的模型在斯坦福大学的MedHELM和MedMarks评测中均位列真实世界医疗应用性能榜首。

发布前的严格测试：99.6%的响应被认定为安全准确

在”ChatGPT for Clinicians”正式发布之前，经过医生顾问团队的系统测试：医生顾问在日常工作中测试了6,924段对话，涵盖临床诊疗、文书记录和医学研究三大场景。结果显示，医生将99.6%的响应评定为安全且准确。

在其中355个样本的子集中，每个样本均由三位独立医生指定了ground-truth引用资料，”ChatGPT for Clinicians”引用这些来源的频率高于人类医生。

即便如此，OpenAI明确强调：”ChatGPT for Clinicians”旨在为临床医生提供信息支持，而非替代其专业判断与临床经验。

五、HealthBench Professional：面向临床实战的开放基准评测

配合”ChatGPT for Clinicians”的发布，OpenAI同步推出了HealthBench Professional——一个面向真实临床医生聊天任务的开放基准评测工具，覆盖三大使用场景：

诊疗咨询（Care Consult）
文书写作与记录（Writing and Documentation）
医学研究（Medical Research）

HealthBench Professional在HealthBench对健康对话的更广泛评估基础上进一步深化，采用医生撰写的对话与评分标准、多阶段医生裁定机制以及严格的数据过滤流程，以衡量常见临床聊天场景下的模型性能与安全性。

数据集的严格性设计

HealthBench Professional的样本经过质量、代表性和难度的三重筛选，以支持对模型进展的持续衡量：

约三分之一的样本涉及医生刻意进行的”红队测试”（Red Teaming），即尝试主动发现模型漏洞；
在整个数据集中，以3.5倍的比例优先选取对模型最具挑战性的对话。

模型性能对比：GPT-5.4在临床工作区中超越人类医生

作为基准比较，OpenAI邀请人类医生在不限时间、可访问网络的情况下，针对其专科领域内的任务生成响应，以此作为强基准线。

评测结果显示：在”ChatGPT for Clinicians”工作区中运行的GPT-5.4不仅超越了基础版GPT-5.4，还超越了OpenAI及外部机构的所有其他模型，以及人类医生的表现。

这一结果充分说明，专为临床场景优化的工作区版本能够显著提升模型的实际表现，工程化与系统优化在AI临床应用中的价值不可忽视。

HealthBench Professional的相关论文及数据集已同步开放，供学术界和产业界研究使用。

六、全球推广计划：从美国出发，逐步走向全球

目前，免费版”ChatGPT for Clinicians”仅面向美国经过认证的医生、执业护士、医师助理及药剂师开放。

在全球扩展方面，OpenAI计划在未来数月内，通过与Better Evidence Network的合作，在当地法规许可的范围内，率先向美国以外的经认证临床医生试点开放。

OpenAI认为，改善人类健康将是AI最具决定性意义的影响之一，但要真正实现这一潜力，需要医疗系统、临床医生、患者、监管机构和科技公司在全球范围内的紧密协作。

配合上述更新，OpenAI还同步发布了Health Blueprint（健康蓝图），为AI在美国医疗领域的负责任整合提供建议框架，以期与医疗界携手合作，推动AI在健康领域充分发挥其潜力。

七、战略意义与行业影响：投资人与科研机构视角

从更宏观的视角来看，OpenAI此次发布”ChatGPT for Clinicians”具有多重战略意涵：

市场渗透策略：免费策略打开临床医生生态入口

将高质量AI工具以免费方式提供给个人认证医生，是OpenAI在医疗垂直领域构建用户生态的关键一步。通过降低使用门槛，OpenAI能够快速积累真实临床数据与用户反馈，进一步优化模型性能，形成正向飞轮效应。

基准评测的开放：推动行业标准化

HealthBench Professional的开放不仅有助于OpenAI建立技术标准话语权，也为整个医疗AI行业提供了统一的评测框架。这对于监管机构制定AI医疗器械审批标准、投资人评估医疗AI公司竞争力、科研机构开展横向比较研究均具有重要参考价值。

合规体系的构建：HIPAA BAA机制

在医疗数据安全和隐私合规方面，HIPAA BAA机制的引入为企业级用户提供了必要的法律保障，这也为未来向医疗机构提供收费企业版服务奠定了基础。

CME学分整合：打通医生教育市场

将CME学分获取与日常AI使用深度绑定，这一功能设计极具商业洞察力。全美每年CME市场规模数十亿美元，将AI工具与继续教育体系打通，既提升了用户黏性，也为OpenAI在医疗教育领域的进一步布局预留了空间。

八、注意事项与局限性说明

尽管评测结果令人印象深刻，OpenAI也在多处明确声明：

“ChatGPT for Clinicians”旨在为临床医生提供信息辅助，而非替代医生的专业判断与临床经验；
当前免费版本仅限美国用户，其他国家需等待后续扩展；
对于涉及受保护健康信息（PHI）的场景，需通过BAA协议另行处理，不在标准免费版范围内；
OpenAI请求社区成员不要在网络上以明文或图片形式公开HealthBench Professional的样本内容，以防止对基础模型训练语料库的污染或模型通过互联网直接检索到ground-truth答案。

“这个版本的ChatGPT是我所见过的最接近理想临床支持伙伴的工具。就像一位随叫随到的会诊专家，可以就从最新指南到账单编码的一切问题提供帮助，而且还能广泛获取儿科及儿科亚专科文献。”——Albert，内科/心脏病科医生

摘要

正文