AI+中医诊断:现状与系统性困境分析
一份关于脉诊、舌诊、腹诊 AI 化进展的判断。核心判断:在理论基础、人才储备、数据质量三环打通之前,AI+中医诊断停留在探索工具阶段,不具备临床革命的条件。
• 调查范围:脉诊、舌诊、腹诊的 AI 技术路线、成果与数据规模
一、对象与方法
调查对象覆盖脉诊、舌诊、腹诊三类诊断方向的 AI 研究,重点关注 2024-2026 年公开发表的成果、数据集、标准文件和器械认证情况。
二、现状
脉诊
• 技术最贴近中医理论(浮中沉取脉),已有 ISO 20498-3:2025 国际标准 • 公开数据:TCM-PulseDB 2025,15,326 例,中西医双重标注 • 申请制数据:国家中医临床研究数据中心,60 万+病历(脉象数据混杂) • 商业私有数据:鹰眼智慧中医大脑,1,100 万+例,不公开 • 瓶颈:多点传感器串扰、定位敏感、难模拟三指同时取脉
舌诊
• 视觉信号易采集,AI 技术最成熟,分类模型 AUC 0.91-0.99 • 临床商用数据:57 万份(标注+病历匹配,三甲医院来源) • 科研高质量数据:最高 6,719 张,773 项舌象表型参数 • 瓶颈:舌尖心肺分区等理论仅有统计相关性,未获因果验证;光源和环境干扰大
腹诊
• 处方对应关系最明确,已有诊疗一体机(2026 年获批 Ⅱ 类医疗器械证) • 临床研究数据:超 4 万例(山东中医药大学等多中心) • 瓶颈:标准化最差——仅河南省地方团体标准,无国标;操作高度依赖手感;无大型公开数据库
关键对比
三、核心问题:四环死锁
调查发现,AI+中医诊断面临的根本障碍不是技术,而是四个环节的系统性互锁。
理论根基乱 → 人才传承断 → 数据源头脏 → 标准化流于形式
↑ ↓
←—————————— 互为因果 ———————————————←理论根基
《黄帝内经》等经典无统一解读,流派繁多,缺乏可验证的共识性基础理论。AI 需要明确的输入输出关系,但中医辨证逻辑本身尚未被形式化。
人才断层
会看病的医生少,懂理论的教授少,且"懂书不懂病"现象普遍——通过执业考证者未必具备临床能力。没有能产出高质量医案的临床医生,就没有可训练 AI 的标注数据。
数据源头
年门诊量 24 亿人次,表面数据海量。但医案记录不规范、四诊信息缺失、诊后管理空白——"数据海量,精准全无"。标注依赖稀缺的好医生,而好医生本身稀缺,标注成本和质量无从保证。
标准化缺失
已发布的标准(如腹诊规范)多为区域性、团体性文件,不具备普适性和强制力,且依赖主观判断。AI 训练需要可重复的输入标准,当前标准无法满足。
四、方向纠偏
当前主流研究存在三个系统性偏差:
1. 技术先行,理论滞后。 经费大量投向传感器、数据库、大模型,回避"中医理论本身是否清晰可验证"。没有理论共识,再好的模型也无法产出可解释的结果。 2. 西化模仿,丢掉主体性。 套用还原论和统计学范式,用西医疾病模型解释中医证候。研究结果在论文中成立,在临床中失效。 3. 数据迷信,忽略源头治理。 追求"大数据"规模,不解决采集标准化、真实性和标注准确性。。
五、建议
短期(1-2 年)
• 优先建立四诊数据采集的强制标准 • 选取 3-5 个高共识证型(如桂枝汤证),做小规模、高质量标注数据集
中期(3-5 年)
• 建立国家级中医临床数据登记平台,强制规范四诊信息字段 • 以"师徒制+规范性考核"替代纯笔试执业认证 • 开展理论验证性研究:对经典辨证逻辑做可重复的临床检验
长期(5-10 年)
• 理论共识达成后,重启 AI 辅助辨证研究 • 建立从数据采集到疗效追踪的完整闭环
检查清单
• 四诊数据采集标准是否全国统一且强制? • 标注医生是否具备独立临床能力? • 训练数据是否可追溯到原始病历? • 模型输出是否能在临床中被独立验证?
结论
好医生、好理论、好数据、好管理——四环打通之前,AI+中医诊断的任何成果应视为探索性工具,不具备临床革命的答案的可能。
夜雨聆风