海外6大医疗AI模型对比(训练数据 + 底层模型 + 技术范式维度)|矩阵投研
从训练数据 + 底层模型 + 核心逻辑 / 技术范式维度
1. Abridge
一、训练 / 运行数据
-
核心:真实医患对话录音(门诊、急诊、专科问诊),脱敏临床语音语料; -
辅助:标准化 SOAP 病历模板、EHR 字段库、临床专科术语、医嘱 / 病程文本; -
约束数据:公共医学指南、常用 ICD/CPT 编码,不依赖海量通用互联网文本。
二、底层 AI 模型
-
主干:医疗垂域微调 LLM(基于主流开源基座二次深度微调); -
配套专用模型:医疗 ASR 语音识别模型(降噪、诊室环境、医学专有名词优化)、小体量临床 NLP 抽取模型; -
无通用大模型强依赖,属于「语音专用模型 + 轻量垂域 LLM」组合。
三、核心技术逻辑
-
先语音降噪 + 实时转写 → 大模型做临床语境理解; -
固定临床结构化范式:自动对齐 SOAP 病历框架,做信息抽取、归纳、补全; -
强场景约束 Prompt,只做文书整理,严控诊断 / 用药类生成,降低幻觉; -
上下文窗口短、推理轻量化,适配门诊实时低延迟。
2. OpenEvidence
一、训练 / 运行数据
-
核心:闭环循证医学数据库,仅限高等级权威医学源; -
数据源:PubMed、JAMA、NEJM、柳叶刀等顶刊论文、临床指南、FDA/CDC 官方诊疗规范; -
排除:自媒体健康内容、非同行评审内容、过时文献,数据定期时效刷新。
二、底层 AI 模型
-
拒绝通用大模型,采用小参数强约束医疗专用 LLM; -
核心架构:轻量化 RAG + 医学知识图谱,生成能力弱、检索 + 事实校验极强; -
不追求通用对话能力,全程事实优先。
三、核心技术逻辑
-
医生问题 → 精准检索权威医学证据库 → 证据分级排序(强 / 中 / 弱推荐); -
「先检索、后总结、禁止自由创作」,所有结论强制标注文献来源; -
内置临床评分工具、诊疗路径规则库,AI 仅做证据整合与对照; -
极致反幻觉设计,模糊结论统一标注证据不足。
3. EliseAI
一、训练 / 运行数据
-
核心:医疗服务流程对话数据(诊所电话、预约、随访、保险咨询、账单沟通); -
辅助:美国医疗行政规则库、保险预授权流程、复诊提醒、合规沟通话术库; -
合规数据:HIPAA 脱敏患者沟通文本,无深度临床诊疗敏感数据。
二、底层 AI 模型
-
主干:对话式垂域 LLM,偏向客服 / 服务场景微调; -
配套:多渠道 NLP(短信、邮件、电话语音)+ 规则引擎 + 流程自动化引擎; -
大模型为辅、流程规则固化为主,保证标准化、合规化。
三、核心技术逻辑
-
标准化医疗服务流程拆解为固定节点; -
LLM 负责自然语言理解、模糊问题识别、多轮沟通; -
规则引擎负责预约排班、保险预审、随访触发、账单答疑等标准化动作; -
完全避开临床诊断,聚焦院内运营与患者自动化沟通。
4. Chai Discovery
一、训练 / 运行数据
-
核心:生物大分子多模态数据;蛋白序列、蛋白 3D 结构、抗体、多肽、靶点结构数据库; -
数据源:PDB 全球蛋白库、生物测序数据、分子动力学模拟数据、抗原 – 抗体结合数据集; -
补充:化合物分子图谱、难成药靶点实验数据。
二、底层 AI 模型
-
主干:生物多模态基础大模型(蛋白 / 结构专用基座); -
核心自研模型:Chai-1/Chai-2、BoltzGen,类 AlphaFold 架构升级; -
技术底座:蛋白质折叠模型 + 从头分子生成模型 + 结构优化预测模型。
三、核心技术逻辑
-
氨基酸序列→原子级 3D 空间结构推理; -
基于大模型零样本 / 少样本生物大分子设计,定向生成抗体、蛋白药物; -
结合物理约束(分子力学、结合能)做结构筛选与优化; -
纯生命科学生成式 AI,和临床问诊、病历类模型完全不同赛道。
5. ChatGPT Health(OpenAI)
一、训练 / 运行数据
-
基座海量通用数据 +公开健康科普、大众医疗文本、慢性病管理资料; -
增量微调:全科医学常识、体检报告通用解读、生活方式健康数据; -
实时增强:轻量化 RAG 接入通用健康知识库,无深度院内 EHR 原始病历数据。
二、底层 AI 模型
-
基座:GPT-4o / GPT-5 通用多模态大模型; -
优化方式:医疗方向 SFT 微调 + 健康场景专用安全护栏; -
多模态融合:支持体检图片、检验报告截图、影像基础文字解读。
三、核心技术逻辑
-
通用大模型强理解能力 + 健康领域轻量化知识补强; -
定位健康辅助:科普、解读、生活建议、慢病管理; -
强权限隔离:严格限制处方、诊断、治疗方案输出; -
轻量化、泛化性强,面向 C 端大众,不深度绑定院内临床流程。
6. Claude for Healthcare(Anthropic)
一、训练 / 运行数据
-
基座:全网高质量通用文本 +海量长格式医疗文档; -
专业医疗数据:临床完整病历、手术记录、护理文书、临床试验报告、医学综述、医保合规文件; -
合规私有化数据:支持医院本地 EHR、FHIR 标准医疗数据私有部署接入,数据隔离不回传。
二、底层 AI 模型
-
基座:Claude Sonnet / Opus 高端大模型; -
核心独有能力:超长篇上下文窗口(百万级 Token); -
安全底座:Constitutional AI 宪法对齐,医疗专用伦理 + 合规对齐; -
配套:医疗 RAG、FHIR / 医疗编码适配接口、企业级私有化架构。
三、核心技术逻辑
-
依靠超长上下文,完整读取整份病历、整套住院文书、整本临床试验档案; -
大模型原生强逻辑推理,做长文本摘要、结构化抽取、跨文档关联分析; -
分层风控:临床建议强限制,行政 / 科研 / 医保类内容完全放开; -
企业级逻辑:大模型原生能力 + 行业合规封装 + 私有数据安全隔离。
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
夜雨聆风