乐于分享
好东西不私藏

面向临床医生的AI助手来了!OpenAI正式推出"ChatGPT for Clinicians",免费向美国医生开放,OpenEvidence的危机

面向临床医生的AI助手来了!OpenAI正式推出"ChatGPT for Clinicians",免费向美国医生开放,OpenEvidence的危机

Making ChatGPT Better for Clinicians


摘要

2026年4月22日,OpenAI正式发布”ChatGPT for Clinicians”(面向临床医生的ChatGPT),这一专为临床工作设计的AI工具现已向美国经过认证的医生、执业护士、医师助理及药剂师免费开放。该产品聚焦临床文书记录、医学研究及诊疗咨询等核心场景,并同步推出开放基准评测工具HealthBench Professional,旨在持续推动医疗AI的安全性与准确性。OpenAI重磅发布医疗保健大模型基准:评估大型语言模型以提升人类健康水平


正文

一、背景:美国医疗系统的挑战与AI应用的加速渗透

当前,美国医疗体系正承受前所未有的压力。临床医生被要求在接诊更多患者的同时,还需应对日益繁重的行政管理任务以及快速扩展的医学文献体系。面对这一困境,越来越多的医疗从业者已经开始主动借助AI工具寻求支持。

根据美国医学会(AMA)2026年发布的一项调查,医生使用AI工具的比例已创历史新高:目前有72%的医生表示在临床实践中使用AI,较去年的48%大幅跃升。全球每周有数百万名临床医生使用ChatGPT支持其日常临床工作,涵盖诊疗咨询、文书写作以及医学研究等应用场景。过去一年中,临床医生对ChatGPT的使用量已超过翻倍。美国医学会2026重磅AI报告- 美国医生如何看待医学大模型增强智能:从效率工具到医疗变革引擎

这一趋势既体现了医疗AI的巨大市场需求,也对AI系统在临床环境中的性能与安全性提出了更高标准。OpenAI意识到,随着AI在临床环境中的需求持续增长,不断提升模型在临床用例中的表现与安全性,并提供能够安全有效支持医疗工作流程的解决方案,已成为一项重大责任。


二、产品演进:从机构版到面向个人临床医生的免费服务

在”ChatGPT for Clinicians”正式发布之前,OpenAI已于2026年初推出了面向机构用户的”ChatGPT for Healthcare”——这一产品允许医疗机构为临床医生、行政管理人员及研究人员大规模部署ChatGPT,同时提供合规性管控支持。目前,美国多家领先医疗系统的临床医生已在使用该系统,大幅提升行政工作处理效率,将更多精力还给患者诊疗。

此次面向个人认证临床医生的免费开放,是OpenAI推动其使命落地的重要一步:确保AGI(通用人工智能)惠及全人类。

目前,免费版”ChatGPT for Clinicians”已向美国经过认证的医生(Physician)、执业护士(NP)、医师助理(PA)及药剂师(Pharmacist)开放注册与使用。


三、核心功能详解:为临床工作量身定制

OpenAI团队与数百位医生顾问合作,深入了解并改进”ChatGPT for Clinicians”的各项能力,确保其切实支持临床医生的关键工作场景。该产品主要包含以下功能模块:

1. 先进AI模型,应对复杂临床问题

为医疗使用场景提供对当前前沿模型的免费访问权限,以更可靠地处理临床问题、研究任务及文书工作。

2. 可复用的临床工作流技能(Skills)

将常用工作流程转化为可复用的”技能”,使ChatGPT能够按固定流程完成任务,例如转诊信撰写、预授权申请(Prior Auth)及患者须知等。

这一功能尤为适合临床医生在日常工作中处理高频率、模板化程度较高的文书工作,大幅降低重复性劳动成本,提升工作效率。

3. 受信任的临床搜索

基于数百万条权威同行评审医学资源,提供实时引用答案,帮助医生更快、更自信地完成病例推理,实现有据可查的医学咨询支持。

4. 跨医学期刊的深度研究

医生可将医学文献综述任务委托给ChatGPT,自主设定信任资源范围,在必要时对研究过程进行干预引导,并在数分钟内获得一份全面、详尽引用的综合报告。

这一功能对于科研型临床医生、医学研究者及临床专科医生尤为重要,能够将原本耗时数天的文献检索工作压缩至分钟级。

5. 从真实临床问题中获得继续医学教育学分(CME)

当临床医生在ChatGPT中探索临床问题时,符合条件的循证医学查阅可自动计入继续医学教育学分,无需额外参加课程或处理繁琐的文书申请。

这一创新功能打破了传统CME获取方式的壁垒,将学习行为与日常工作无缝融合,极具实践价值。

6. 可选的HIPAA合规支持

许多临床任务不涉及受保护健康信息(PHI),但如有需要,符合条件的账户可通过签署业务伙伴协议(BAA)获得HIPAA合规支持。

7. 账户安全与隐私保护

对话内容不会被用于模型训练,同时提供多因素认证(MFA)等多重保护措施,确保敏感工作信息的安全。


四、持续评估与安全性强化:700,000余条医生审核记录

在医疗AI领域,安全性与准确性是产品价值的根本所在。OpenAI持续改进ChatGPT在医疗场景中的响应安全性和准确性。OpenAI的医生顾问团队持续审查模型响应,并就响应质量、推理逻辑、可信度及安全性提供专业反馈。

截至目前,OpenAI的医生顾问已审阅超过70万条模型响应,这些响应真实反映了临床医生和患者在现实世界中使用ChatGPT的场景;平均每隔几分钟,就会有一条新的模型响应接受医生审阅。

在第三方评测方面,OpenAI的模型在斯坦福大学的MedHELM和MedMarks评测中均位列真实世界医疗应用性能榜首。

发布前的严格测试:99.6%的响应被认定为安全准确

在”ChatGPT for Clinicians”正式发布之前,经过医生顾问团队的系统测试:医生顾问在日常工作中测试了6,924段对话,涵盖临床诊疗、文书记录和医学研究三大场景。结果显示,医生将99.6%的响应评定为安全且准确。

在其中355个样本的子集中,每个样本均由三位独立医生指定了ground-truth引用资料,”ChatGPT for Clinicians”引用这些来源的频率高于人类医生。

即便如此,OpenAI明确强调:”ChatGPT for Clinicians”旨在为临床医生提供信息支持,而非替代其专业判断与临床经验。


五、HealthBench Professional:面向临床实战的开放基准评测

配合”ChatGPT for Clinicians”的发布,OpenAI同步推出了HealthBench Professional——一个面向真实临床医生聊天任务的开放基准评测工具,覆盖三大使用场景:

  • 诊疗咨询(Care Consult)
  • 文书写作与记录(Writing and Documentation)
  • 医学研究(Medical Research)

HealthBench Professional在HealthBench对健康对话的更广泛评估基础上进一步深化,采用医生撰写的对话与评分标准多阶段医生裁定机制以及严格的数据过滤流程,以衡量常见临床聊天场景下的模型性能与安全性。

数据集的严格性设计

HealthBench Professional的样本经过质量、代表性和难度的三重筛选,以支持对模型进展的持续衡量:

  • 约三分之一的样本涉及医生刻意进行的”红队测试”(Red Teaming),即尝试主动发现模型漏洞;
  • 在整个数据集中,以3.5倍的比例优先选取对模型最具挑战性的对话。

模型性能对比:GPT-5.4在临床工作区中超越人类医生

作为基准比较,OpenAI邀请人类医生在不限时间、可访问网络的情况下,针对其专科领域内的任务生成响应,以此作为强基准线。

评测结果显示:在”ChatGPT for Clinicians”工作区中运行的GPT-5.4不仅超越了基础版GPT-5.4,还超越了OpenAI及外部机构的所有其他模型,以及人类医生的表现。

这一结果充分说明,专为临床场景优化的工作区版本能够显著提升模型的实际表现,工程化与系统优化在AI临床应用中的价值不可忽视。

HealthBench Professional的相关论文及数据集已同步开放,供学术界和产业界研究使用。


六、全球推广计划:从美国出发,逐步走向全球

目前,免费版”ChatGPT for Clinicians”仅面向美国经过认证的医生、执业护士、医师助理及药剂师开放。

在全球扩展方面,OpenAI计划在未来数月内,通过与Better Evidence Network的合作,在当地法规许可的范围内,率先向美国以外的经认证临床医生试点开放。

OpenAI认为,改善人类健康将是AI最具决定性意义的影响之一,但要真正实现这一潜力,需要医疗系统、临床医生、患者、监管机构和科技公司在全球范围内的紧密协作。

配合上述更新,OpenAI还同步发布了Health Blueprint(健康蓝图),为AI在美国医疗领域的负责任整合提供建议框架,以期与医疗界携手合作,推动AI在健康领域充分发挥其潜力。


七、战略意义与行业影响:投资人与科研机构视角

从更宏观的视角来看,OpenAI此次发布”ChatGPT for Clinicians”具有多重战略意涵:

市场渗透策略:免费策略打开临床医生生态入口

将高质量AI工具以免费方式提供给个人认证医生,是OpenAI在医疗垂直领域构建用户生态的关键一步。通过降低使用门槛,OpenAI能够快速积累真实临床数据与用户反馈,进一步优化模型性能,形成正向飞轮效应。

基准评测的开放:推动行业标准化

HealthBench Professional的开放不仅有助于OpenAI建立技术标准话语权,也为整个医疗AI行业提供了统一的评测框架。这对于监管机构制定AI医疗器械审批标准、投资人评估医疗AI公司竞争力、科研机构开展横向比较研究均具有重要参考价值。

合规体系的构建:HIPAA BAA机制

在医疗数据安全和隐私合规方面,HIPAA BAA机制的引入为企业级用户提供了必要的法律保障,这也为未来向医疗机构提供收费企业版服务奠定了基础。

CME学分整合:打通医生教育市场

将CME学分获取与日常AI使用深度绑定,这一功能设计极具商业洞察力。全美每年CME市场规模数十亿美元,将AI工具与继续教育体系打通,既提升了用户黏性,也为OpenAI在医疗教育领域的进一步布局预留了空间。


八、注意事项与局限性说明

尽管评测结果令人印象深刻,OpenAI也在多处明确声明:

  • “ChatGPT for Clinicians”旨在为临床医生提供信息辅助,而非替代医生的专业判断与临床经验;
  • 当前免费版本仅限美国用户,其他国家需等待后续扩展;
  • 对于涉及受保护健康信息(PHI)的场景,需通过BAA协议另行处理,不在标准免费版范围内;
  • OpenAI请求社区成员不要在网络上以明文或图片形式公开HealthBench Professional的样本内容,以防止对基础模型训练语料库的污染或模型通过互联网直接检索到ground-truth答案。

“这个版本的ChatGPT是我所见过的最接近理想临床支持伙伴的工具。就像一位随叫随到的会诊专家,可以就从最新指南到账单编码的一切问题提供帮助,而且还能广泛获取儿科及儿科亚专科文献。”——Albert,内科/心脏病科医生


相关标签

ChatGPT for Clinicians | HealthBench Professional | 医疗人工智能 | 临床辅助决策 | 医学文献研究 | AI合规医疗 OpenEvidence


本文根据OpenAI官方发布内容整理改编,发布日期:2026年4月22日。

加入知识星球,获取医疗、医药大健康AI产学研最新资料,包括全球最新论文及中文解读,电子书,白皮书,研究报告等

[130页中英文报告] Arise联合哈佛、斯坦福医学院重磅发布,临床AI的现实困境与未来图景:2026年临床AI现状报告深度解读

[Nature子刊NPJ]医疗领域的AI智能体:应用、评估与未来方向

【深度】从孤立工具到模块化生态:Claw4Science 如何统一 2200+ 科学小龙虾AI技能,重塑科研范式

迈向医学AI科学家:一个会自己做医学研究、写论文的AI超级助手,重塑医学研究的未来 – 港中文&斯坦福等

AutoResearchClaw:从研究想法到学术论文的完全自主化工具

LabClaw:集成206项智能技能的生物医学“龙虾”的智能利器

医疗智能助手MedClaw:9大职业场景、21个任务模板、动态流程调整的医疗AI执行系统

BioClaw:通过WhatsApp实现的 NanoClaw驱动生物信息学研究助手

MedOpenClaw-医学影像AI“小龙虾”驱动的可审计医学影像AI诊疗体系:从静态图像到全量动态临床工作流的突破

医生们,你们低估了AI的“手”有多可怕 —— 3天搭了个24/7的OpenClaw个人超级助理,它干掉了80%的人力工作量

清华”紫荆AI医院”全面升级:医生克隆数字分身,虚拟诊室向全球开放

AI时代的超级医生:Ontology Agent驱动的从被动医疗到主动科研、医工转化的全流程新范式

10分钟自动撰写推文,医学版OpenClaw”龙虾”超级个体正式上线!南加州大学 MED-COPILOT 重新定义临床决策支持,GraphRAG 技术引爆行业革命

OpenClaw Skill “中医生物医学研究策略师”赋能中医药研究:从网络药理学到分子机制的智能化探索

医疗AI迎来个性化革命:OpenEvidence发布Dotflows,让每位临床医生都能定制专属AI原生工作流

OpenClaw能做医院 AI 操作系统吗?重构动态临床AI工作流的基础设施

OpenClaw Medical Skills:全球最大的开源医疗AI技能库

当母胎医学临床医生遇上”龙虾”:一次OpenClaw自主智能体Agent实验的终止启示

医药大健康行业的Palantir如何建设,大模型时代本体论Ontology驱动的医学知识管理到智能决策系统的未来进化

Nature – AI科学家系统实现科研全自动化:从构想到发表的端到端自动化

百日决战第三篇:临床医学专家如何化身”医学AI创业公司CEO”, 打造一份让国自然评审“非投不可”的医工交叉项目商业计划书

[20页PPT]全球Top MNC药企正在做什么样的大模型POC?从研发、临床到医学、市场商业化的全链条创新应用概览

[100页中英文PDF]全球医学大模型智能体全景图综述:从诊断工具到临床工作流变革的医疗新范式转型

护理”大模型+知识图谱”实践的智能化突破:基于大模型构建乳腺癌化疗所致恶心呕吐知识图谱

[72页]谷歌推出个性化实时监测主动健康管理大模型PH-LLM

AI时代的医学事务知识管理革命

辉瑞制药医学信息与生成式人工智能的融合——从试点到全球推广

深度长文:揭秘全球首个“超级AI医院”背后的万亿野心,从北京中关村到海南博鳌!

2026年国家自然科学基金:护理学人工智能(AI+Nursing)项目申报指南

护理”大模型+知识图谱”实践的智能化突破:基于大模型构建乳腺癌化疗所致恶心呕吐知识图谱