乐于分享
好东西不私藏

海外6大医疗AI模型对比(训练数据 + 底层模型 + 技术范式维度)|矩阵投研

海外6大医疗AI模型对比(训练数据 + 底层模型 + 技术范式维度)|矩阵投研

训练数据 + 底层模型 + 核心逻辑 / 技术范式维度

1. Abridge

一、训练 / 运行数据

  1. 核心:真实医患对话录音(门诊、急诊、专科问诊),脱敏临床语音语料;
  2. 辅助:标准化 SOAP 病历模板、EHR 字段库、临床专科术语、医嘱 / 病程文本;
  3. 约束数据:公共医学指南、常用 ICD/CPT 编码,不依赖海量通用互联网文本

二、底层 AI 模型

  1. 主干:医疗垂域微调 LLM(基于主流开源基座二次深度微调);
  2. 配套专用模型:医疗 ASR 语音识别模型(降噪、诊室环境、医学专有名词优化)、小体量临床 NLP 抽取模型;
  3. 无通用大模型强依赖,属于「语音专用模型 + 轻量垂域 LLM」组合。

三、核心技术逻辑

  1. 先语音降噪 + 实时转写 → 大模型做临床语境理解
  2. 固定临床结构化范式:自动对齐 SOAP 病历框架,做信息抽取、归纳、补全;
  3. 场景约束 Prompt,只做文书整理,严控诊断 / 用药类生成,降低幻觉;
  4. 上下文窗口短、推理轻量化,适配门诊实时低延迟。

2. OpenEvidence

一、训练 / 运行数据

  1. 核心:闭环循证医学数据库,仅限高等级权威医学源;
  2. 数据源:PubMed、JAMA、NEJM、柳叶刀等顶刊论文、临床指南、FDA/CDC 官方诊疗规范;
  3. 排除:自媒体健康内容、非同行评审内容、过时文献,数据定期时效刷新。

二、底层 AI 模型

  1. 拒绝通用大模型,采用小参数强约束医疗专用 LLM
  2. 核心架构:轻量化 RAG + 医学知识图谱,生成能力弱、检索 + 事实校验极强;
  3. 不追求通用对话能力,全程事实优先

三、核心技术逻辑

  1. 医生问题 → 精准检索权威医学证据库 → 证据分级排序(强 / 中 / 弱推荐);
  2. 先检索、后总结、禁止自由创作」,所有结论强制标注文献来源;
  3. 内置临床评分工具、诊疗路径规则库,AI 仅做证据整合与对照;
  4. 极致反幻觉设计,模糊结论统一标注证据不足。

3. EliseAI

一、训练 / 运行数据

  1. 核心:医疗服务流程对话数据(诊所电话、预约、随访、保险咨询、账单沟通);
  2. 辅助:美国医疗行政规则库、保险预授权流程、复诊提醒、合规沟通话术库;
  3. 合规数据:HIPAA 脱敏患者沟通文本,无深度临床诊疗敏感数据。

二、底层 AI 模型

  1. 主干:对话式垂域 LLM,偏向客服 / 服务场景微调;
  2. 配套:多渠道 NLP(短信、邮件、电话语音)+ 规则引擎 + 流程自动化引擎
  3. 大模型为辅、流程规则固化为主,保证标准化、合规化。

三、核心技术逻辑

  1. 标准化医疗服务流程拆解为固定节点;
  2. LLM 负责自然语言理解、模糊问题识别、多轮沟通;
  3. 规则引擎负责预约排班、保险预审、随访触发、账单答疑等标准化动作;
  4. 完全避开临床诊断,聚焦院内运营与患者自动化沟通

4. Chai Discovery

一、训练 / 运行数据

  1. 核心:生物大分子多模态数据;蛋白序列、蛋白 3D 结构、抗体、多肽、靶点结构数据库;
  2. 数据源:PDB 全球蛋白库、生物测序数据、分子动力学模拟数据、抗原 – 抗体结合数据集;
  3. 补充:化合物分子图谱、难成药靶点实验数据。

二、底层 AI 模型

  1. 主干:生物多模态基础大模型(蛋白 / 结构专用基座);
  2. 核心自研模型:Chai-1/Chai-2、BoltzGen,类 AlphaFold 架构升级;
  3. 技术底座:蛋白质折叠模型 + 从头分子生成模型 + 结构优化预测模型

三、核心技术逻辑

  1. 氨基酸序列→原子级 3D 空间结构推理;
  2. 基于大模型零样本 / 少样本生物大分子设计,定向生成抗体、蛋白药物;
  3. 结合物理约束(分子力学、结合能)做结构筛选与优化;
  4. 生命科学生成式 AI,和临床问诊、病历类模型完全不同赛道。

5. ChatGPT Health(OpenAI)

一、训练 / 运行数据

  1. 基座海量通用数据 +公开健康科普、大众医疗文本、慢性病管理资料
  2. 增量微调:全科医学常识、体检报告通用解读、生活方式健康数据;
  3. 实时增强:轻量化 RAG 接入通用健康知识库,无深度院内 EHR 原始病历数据。

二、底层 AI 模型

  1. 基座:GPT-4o / GPT-5 通用多模态大模型
  2. 优化方式:医疗方向 SFT 微调 + 健康场景专用安全护栏;
  3. 多模态融合:支持体检图片、检验报告截图、影像基础文字解读。

三、核心技术逻辑

  1. 通用大模型强理解能力 + 健康领域轻量化知识补强;
  2. 定位健康辅助:科普、解读、生活建议、慢病管理;
  3. 强权限隔离:严格限制处方、诊断、治疗方案输出;
  4. 轻量化、泛化性强,面向 C 端大众,不深度绑定院内临床流程。

6. Claude for Healthcare(Anthropic)

一、训练 / 运行数据

  1. 基座:全网高质量通用文本 +海量长格式医疗文档
  2. 专业医疗数据:临床完整病历、手术记录、护理文书、临床试验报告、医学综述、医保合规文件;
  3. 合规私有化数据:支持医院本地 EHR、FHIR 标准医疗数据私有部署接入,数据隔离不回传。

二、底层 AI 模型

  1. 基座:Claude Sonnet / Opus 高端大模型
  2. 核心独有能力:超长篇上下文窗口(百万级 Token);
  3. 安全底座:Constitutional AI 宪法对齐,医疗专用伦理 + 合规对齐;
  4. 配套:医疗 RAG、FHIR / 医疗编码适配接口、企业级私有化架构。

三、核心技术逻辑

  1. 依靠超长上下文,完整读取整份病历、整套住院文书、整本临床试验档案
  2. 大模型原生强逻辑推理,做长文本摘要、结构化抽取、跨文档关联分析;
  3. 分层风控:临床建议强限制,行政 / 科研 / 医保类内容完全放开;
  4. 企业级逻辑:大模型原生能力 + 行业合规封装 + 私有数据安全隔离
平台名称
训练 / 运行数据
AI 模型
核心逻辑
Abridge
脱敏医患对话语音、临床 SOAP 病历、医疗专科术语、ICD/CPT 编码、EHR 字段数据
医疗垂域微调 LLM + 医疗专用 ASR 语音模型 + 轻量临床 NLP 抽取模型
语音实时转写→临床语境理解→按 SOAP 格式自动生成结构化病历,严控诊断生成,低延迟适配门诊
OpenEvidence
PubMed、顶刊论文、权威临床指南、FDA/CDC 诊疗规范、高等级循证医学文献
小参数医疗专用 LLM + 轻量化 RAG + 医学知识图谱
先检索权威证据→分级筛选→事实性总结,禁止自由生成,全结论溯源,极致反幻觉
EliseAI
医疗行政对话数据、预约 / 随访 / 保险咨询话术、HIPAA 脱敏患者沟通文本、医疗流程规则库
对话式垂域 LLM + 多渠道 NLP + 流程规则引擎
大模型理解沟通意图 + 规则引擎执行标准化流程,聚焦医疗行政自动化,无临床诊疗
Chai Discovery
全球蛋白库、蛋白 / 抗体 3D 结构数据、分子测序数据、抗原 – 抗体结合数据集
生物多模态大模型(Chai-1/Chai-2、BoltzGen)+ 蛋白质折叠 / 分子生成模型
氨基酸序列推理原子级结构→零样本设计生物大分子→靶向优化,助力创新药研发
ChatGPT Health
公开健康科普、慢病管理资料、体检报告数据、通用医疗常识文本
GPT-4o/GPT-5 通用多模态大模型 + 医疗场景 SFT 微调
通用大模型 + 健康场景优化,主打大众健康辅助,严格隔离诊断 / 处方等临床输出
Claude for Healthcare
长格式医疗文档、完整病历 / 临床文书、医保合规文件、临床试验数据、FHIR 标准医疗数据
Claude Opus/Sonnet 大模型 + Constitutional AI 安全架构 + 医疗专用 RAG
超长上下文无损解析医疗长文档,实现文本摘要、跨文档关联,分层风控适配企业医疗场景