
在AI与医疗交汇的十字路口,我们目睹了太多的雄心与叹息。
小病没需求,大病信不着,有人称之为最难赛道,有人感慨其商业化之困。
过去一年,我们对话了近3000名医疗从业者,从三甲医院的主任医师、迷茫的规培生,到顶尖机构的AI科学家、连续创业者。
一个共识逐渐浮现:AI医疗的核心矛盾,并非技术本身,而在于技术逻辑与行业逻辑从未真正同频。
我们看到破界者们的勇敢:
21岁的口腔医学生吕坤弃医从AI,创建了全网最大的AI医疗垂类社群;
985临床本硕的Zin,为追寻对计算机的热爱转身离开体制,成为一名AI医疗技术专家;
北医博士June完成跨界,攻读CES博士后,指出医疗人面临双重语言体系与双重思维模型的鸿沟。
这些个体的探索闪耀着光芒,却也照出了系统性困境的深影:力量分散,回声微弱。
因此,我们创立了山甲实验室,推出了品牌 “穿三甲Pangolin” 。
我们无意成为又一个高喊颠覆医疗的科技布道者,也不愿仅仅停留在破界的呐喊之中。
我们想做一只穿山甲:承认眼前横亘着医疗体系、学科壁垒、支付迷局、合规风险等重重山岭。
我们不求移山填海的巨力,而是潜心钻研穿山之法:
找到岩层的缝隙,打通连通的隧道,让价值得以流动,让创新得以生根。
01
三重山岭:横在AI医疗面前的困境
AI医疗概念图 来源:達志影像/shutterstock
AI医疗的困境,远非技术不成熟一言可蔽。
它是由多个彼此嵌套、相互加固的系统性壁垒构成的复合体。
第一重山:学科间的沟通壁垒
临床医生、产品经理、算法工程师、投资人,仿佛说着不同的语言。
临床端困惑于AI到底能解决什么实际问题;
产品端苦恼于难以触及真实的医疗场景;
技术端痴迷于模型指标却忽略临床可解释性;
创投端则在火热概念与萧条营收间反复摇摆。
这并非任何一方的过错,而是固有思维范式与评价体系迥异导致的必然摩擦。
第二重山:付费方的摇摆不定
在中国,AI医疗的“最终支付方是谁?”成了一个灵魂拷问。
医院、患者、医保、商保、药企……每一方似乎都有需求,但每一方的诉求又微妙错位。
医院的核心诉求是提升效率、管控成本、符合医保(DRG/DIP)支付要求、增加科研产出。
一个AI产品若不能嵌入现有工作流,直接关联到病案首页质量、平均住院日或国自然申报,就很难打动院长。
有一种观点认为,保险行业可能是破局关键。
因其手握海量健康与理赔数据,且有强烈的动力通过健康管理降低赔付率。
然而,这条路因为国内的商保比重并不高而同样漫长。
与此同时,“To C变现几乎不可能”成为许多从业者的血泪共识:
轻症健康管理缺乏付费意愿,重症诊疗又极度依赖线下权威与信任,AI难以跨越。
第三重山:激励奖赏结构所限
将硅谷的模式简单复制到中国,注定水土不服。
美国的医疗AI可以围绕FDA的SaMD(软件即医疗器械) 框架推进,有相对清晰的报销路径(如CMS)。
而中国的医疗体系以公立医院为主体,政策驱动性强,区域差异大。
激励结构的根本不同,决定了任何AI医疗解决方案都必须进行深度的本土化重构,而非简单的技术平移。
02
移山之力:为什么我们不做愚公?
愚公移山神话故事 来源:Medium
过去十年,“互联网+医疗”曾试图以平台的规模效应“移山”,构建线上问诊、药品配送的线性闭环。
然而,结果常常是信息的耗散与责任的悬置。
线上轻问诊难以承接复杂病情,医患之间的深度信任无法通过屏幕建立,其商业模式也屡陷盈利困局。
进入AI时代,我们警惕另一种移山思维:迷信科技的降维打击。
第二种移山幻觉,是试图用一个大语言模型解决所有问题。
医疗AI的核心壁垒,可能并非医学知识的堆砌,而是基座模型对客观世界运行规律的逻辑认知能力(即第一性原理思考)。
一味追求在医疗数据上堆砌数据,却忽视了模型本身推理能力这座更基础的山峰,是本末倒置。
更致命的是,许多为了合规而过度对齐、切除逻辑能力的垂直模型,反而会一本正经地胡说八道,这在医疗场景中是致命的。
第三种,也是最深刻的“移山”幻觉,是试图用技术逻辑,强行重构医疗的权责体系与伦理基石。
这是所有失败中最昂贵的教训。Forward公司曾融资超6亿美元,梦想在全美商场部署AI自助医疗舱,最终烧光资金、宣告破产。
它失败的核心原因,是试图用消费互联网的自助、便捷体验,去覆盖低频、高风险、强监管的严肃医疗流程。
医疗里最贵的从来不是技术,而是对数据清洗、诊疗流程、合规留痕与责任链条的深刻敬畏。
移山思维的谬误在于,它假设医疗体系的山是等待被移除的障碍。
但实际上,这些山——严谨的规范、保守的伦理、复杂的流程、深植的信任——恰恰是医疗行业的基石与护城河。
试图推翻它们,不仅徒劳,而且危险。
AI的真正价值,不在于成为推土机,而在于成为勘探仪和隧道掘进机,帮助我们理解山体的结构,并在其中开辟出能让价值顺畅流通的新路径。
03
穿山之法:我们的第一个抓手
穿山甲Pangolin 来源:Dialogue Earth
穿山甲何以穿山?靠的不是蛮力,而是对地质结构的精准感知,以及特化工具的持续挖掘。
对于山甲实验室,我们选择的第一个特化工具与核心抓手是:多维、务实、场景化的测评。
我们理解的测评,绝非简单的排行榜或参数对比。
它是一种学科间翻译的过程 ,旨在弥合前述的认知鸿沟,让不同领域的专家能在共同的、基于事实的语境下对话。
我们不止步于问哪个大模型医学考试得分更高?
我们更要问:在急诊腹痛分诊的场景下,AI能否减少漏诊危急重症的概率?
在辅助基层医生阅读胸片时,AI的建议能否被理解、被信任,且真正提升诊断信心?
我们将借鉴国际开源基准如HealthBench的思路,但更聚焦于中国本土的高发疾病、典型诊疗路径和医患沟通习惯。
测评维度将涵盖:
临床准确性:是否符合最新指南与循证医学。
推理可解释性:能否给出符合临床思维逻辑的推导过程,而非“黑箱”答案。
工作流适配性:交互设计是否符合医护人员繁忙场景下的使用习惯。 安全性护栏:对于不确定或超范围的问题,是否有足够的警示与拒答机制。
因此,山甲实验室的测评,绝非为了制造又一期吸引眼球的热榜。
对医生(尤其是年轻医生)而言,这套测评是将他们碎片化、感性化的使用体验压缩成标准化、可比较、有证据力的用户需求说明。
它替沉默的大多数发声:我们需要的不只是答案,更是可靠的事实记录、清晰的行动优先级、以及绝不越界的责任意识。
对产品与技术团队而言,这套测评是真实临床反馈。
它照见的不是参数优劣,而是你的产品逻辑与真实医疗工作流之间,那些细微却关键的错位:
是事实抽取的颗粒度不够,还是闭环设计的意识缺失?是过于追求学术表达,还是忽视了诊疗流程的现实约束?
对整个生态而言,这套测评希望成为一种对话语法。
当临床、产品、技术再次坐在一起时,我们不再空谈“赋能”、“颠覆”,而是可以指着具体的测评维度说:
我们在风险分层意识上丢分了,因为AI没有给出明确的时间注明;
我们在场景适配性上需要改进,因为没分清基层能做的检查和必须上转的项目。
测评,是我们的起点。而打通价值隧道,让创新得以流通,让患者最终受益,是我们共同的目的地。
结语:贯而不破,医路相通

“穿三甲”的品牌寓意正在于此:贯穿壁垒,而不破坏生态;打通路径,以求价值相通。
我们不相信AI能解决所有医疗痛点,但我们坚信,通过持续、精细的穿山工作——测评、翻译、连接、共创——能够一点一点地改变局面。
山甲实验室将不仅仅是一个测评平台。我们将以测评为起点,逐步构建一个跨学科的压力测试场、一个解决方案的共创工坊。
我们会聚集那些不甘被困在固有轨道上的医疗超级个体,
无论是想用AI优化临床路径的医生,还是试图理解医疗真实需求的技术极客,或是探索新商业模式的跨界创业者。
AI医疗的终局,或许不是某个巨型平台的垄断,而是在AI这个协作枢纽的连接下,形成一个更为动态、多元、韧性的新生态。
这条路注定需要耐心与匠心。我们愿做那只沉默的穿山甲,用每一次精准的挖掘,去证明:打通一座山的价值,远大于呼喊移走一万座山。
医路漫漫,与君相伴,穿山而行。
夜雨聆风

