AI医疗需要的:不是移山之力,而是穿山之法

在AI与医疗交汇的十字路口，我们目睹了太多的雄心与叹息。

小病没需求，大病信不着，有人称之为最难赛道，有人感慨其商业化之困。

过去一年，我们对话了近3000名医疗从业者，从三甲医院的主任医师、迷茫的规培生，到顶尖机构的AI科学家、连续创业者。

一个共识逐渐浮现：AI医疗的核心矛盾，并非技术本身，而在于技术逻辑与行业逻辑从未真正同频。

我们看到破界者们的勇敢：

21岁的口腔医学生吕坤弃医从AI，创建了全网最大的AI医疗垂类社群；

985临床本硕的Zin，为追寻对计算机的热爱转身离开体制，成为一名AI医疗技术专家；

北医博士June完成跨界，攻读CES博士后，指出医疗人面临双重语言体系与双重思维模型的鸿沟。

这些个体的探索闪耀着光芒，却也照出了系统性困境的深影：力量分散，回声微弱。

因此，我们创立了山甲实验室，推出了品牌 “穿三甲Pangolin” 。

我们无意成为又一个高喊颠覆医疗的科技布道者，也不愿仅仅停留在破界的呐喊之中。

我们想做一只穿山甲：承认眼前横亘着医疗体系、学科壁垒、支付迷局、合规风险等重重山岭。

我们不求移山填海的巨力，而是潜心钻研穿山之法：

找到岩层的缝隙，打通连通的隧道，让价值得以流动，让创新得以生根。

01 三重山岭：横在AI医疗面前的困境

AI医疗概念图来源：達志影像/shutterstock

AI医疗的困境，远非技术不成熟一言可蔽。

它是由多个彼此嵌套、相互加固的系统性壁垒构成的复合体。

第一重山：学科间的沟通壁垒

临床医生、产品经理、算法工程师、投资人，仿佛说着不同的语言。

临床端困惑于AI到底能解决什么实际问题；

产品端苦恼于难以触及真实的医疗场景；

技术端痴迷于模型指标却忽略临床可解释性；

创投端则在火热概念与萧条营收间反复摇摆。

这并非任何一方的过错，而是固有思维范式与评价体系迥异导致的必然摩擦。

第二重山：付费方的摇摆不定

在中国，AI医疗的“最终支付方是谁？”成了一个灵魂拷问。

医院、患者、医保、商保、药企……每一方似乎都有需求，但每一方的诉求又微妙错位。

医院的核心诉求是提升效率、管控成本、符合医保（DRG/DIP）支付要求、增加科研产出。

一个AI产品若不能嵌入现有工作流，直接关联到病案首页质量、平均住院日或国自然申报，就很难打动院长。

有一种观点认为，保险行业可能是破局关键。

因其手握海量健康与理赔数据，且有强烈的动力通过健康管理降低赔付率。

然而，这条路因为国内的商保比重并不高而同样漫长。

与此同时，“To C变现几乎不可能”成为许多从业者的血泪共识：

轻症健康管理缺乏付费意愿，重症诊疗又极度依赖线下权威与信任，AI难以跨越。

第三重山：激励奖赏结构所限

将硅谷的模式简单复制到中国，注定水土不服。

美国的医疗AI可以围绕FDA的SaMD（软件即医疗器械） 框架推进，有相对清晰的报销路径（如CMS）。

而中国的医疗体系以公立医院为主体，政策驱动性强，区域差异大。

激励结构的根本不同，决定了任何AI医疗解决方案都必须进行深度的本土化重构，而非简单的技术平移。

02 移山之力：为什么我们不做愚公？

愚公移山神话故事来源：Medium

过去十年，“互联网+医疗”曾试图以平台的规模效应“移山”，构建线上问诊、药品配送的线性闭环。

然而，结果常常是信息的耗散与责任的悬置。

线上轻问诊难以承接复杂病情，医患之间的深度信任无法通过屏幕建立，其商业模式也屡陷盈利困局。

进入AI时代，我们警惕另一种移山思维：迷信科技的降维打击。

在今天，蚂蚁阿福能站在健康助手的C位，本质是平台特权与生态优势的体现。

医疗AI的真正壁垒，从来不是算法多精准，而是谁能担责、谁能闭环、谁能在用户焦虑的瞬间成为第一选择。

对于绝大多数创业者而言，这是一条无法复制的路径。

第二种移山幻觉，是试图用一个大语言模型解决所有问题。

医疗AI的核心壁垒，可能并非医学知识的堆砌，而是基座模型对客观世界运行规律的逻辑认知能力（即第一性原理思考）。

一味追求在医疗数据上堆砌数据，却忽视了模型本身推理能力这座更基础的山峰，是本末倒置。

更致命的是，许多为了合规而过度对齐、切除逻辑能力的垂直模型，反而会一本正经地胡说八道，这在医疗场景中是致命的。

第三种，也是最深刻的“移山”幻觉，是试图用技术逻辑，强行重构医疗的权责体系与伦理基石。

这是所有失败中最昂贵的教训。Forward公司曾融资超6亿美元，梦想在全美商场部署AI自助医疗舱，最终烧光资金、宣告破产。

它失败的核心原因，是试图用消费互联网的自助、便捷体验，去覆盖低频、高风险、强监管的严肃医疗流程。

医疗里最贵的从来不是技术，而是对数据清洗、诊疗流程、合规留痕与责任链条的深刻敬畏。

移山思维的谬误在于，它假设医疗体系的山是等待被移除的障碍。

但实际上，这些山——严谨的规范、保守的伦理、复杂的流程、深植的信任——恰恰是医疗行业的基石与护城河。

试图推翻它们，不仅徒劳，而且危险。

AI的真正价值，不在于成为推土机，而在于成为勘探仪和隧道掘进机，帮助我们理解山体的结构，并在其中开辟出能让价值顺畅流通的新路径。

03 穿山之法：我们的第一个抓手

穿山甲Pangolin 来源：Dialogue Earth

穿山甲何以穿山？靠的不是蛮力，而是对地质结构的精准感知，以及特化工具的持续挖掘。

对于山甲实验室，我们选择的第一个特化工具与核心抓手是：多维、务实、场景化的测评。

我们理解的测评，绝非简单的排行榜或参数对比。

它是一种学科间翻译的过程，旨在弥合前述的认知鸿沟，让不同领域的专家能在共同的、基于事实的语境下对话。

我们不止步于问哪个大模型医学考试得分更高？

我们更要问：在急诊腹痛分诊的场景下，AI能否减少漏诊危急重症的概率？

在辅助基层医生阅读胸片时，AI的建议能否被理解、被信任，且真正提升诊断信心？

我们将借鉴国际开源基准如HealthBench的思路，但更聚焦于中国本土的高发疾病、典型诊疗路径和医患沟通习惯。

测评维度将涵盖：

临床准确性：是否符合最新指南与循证医学。
推理可解释性：能否给出符合临床思维逻辑的推导过程，而非“黑箱”答案。
工作流适配性：交互设计是否符合医护人员繁忙场景下的使用习惯。
安全性护栏：对于不确定或超范围的问题，是否有足够的警示与拒答机制。

因此，山甲实验室的测评，绝非为了制造又一期吸引眼球的热榜。

对医生（尤其是年轻医生）而言，这套测评是将他们碎片化、感性化的使用体验压缩成标准化、可比较、有证据力的用户需求说明。

它替沉默的大多数发声：我们需要的不只是答案，更是可靠的事实记录、清晰的行动优先级、以及绝不越界的责任意识。

对产品与技术团队而言，这套测评是真实临床反馈。

它照见的不是参数优劣，而是你的产品逻辑与真实医疗工作流之间，那些细微却关键的错位：

是事实抽取的颗粒度不够，还是闭环设计的意识缺失？是过于追求学术表达，还是忽视了诊疗流程的现实约束？

对整个生态而言，这套测评希望成为一种对话语法。

当临床、产品、技术再次坐在一起时，我们不再空谈“赋能”、“颠覆”，而是可以指着具体的测评维度说：

我们在风险分层意识上丢分了，因为AI没有给出明确的时间注明；

我们在场景适配性上需要改进，因为没分清基层能做的检查和必须上转的项目。

测评，是我们的起点。而打通价值隧道，让创新得以流通，让患者最终受益，是我们共同的目的地。

结语：贯而不破，医路相通

“穿三甲”的品牌寓意正在于此：贯穿壁垒，而不破坏生态；打通路径，以求价值相通。

我们不相信AI能解决所有医疗痛点，但我们坚信，通过持续、精细的穿山工作——测评、翻译、连接、共创——能够一点一点地改变局面。

山甲实验室将不仅仅是一个测评平台。我们将以测评为起点，逐步构建一个跨学科的压力测试场、一个解决方案的共创工坊。

我们会聚集那些不甘被困在固有轨道上的医疗超级个体，

无论是想用AI优化临床路径的医生，还是试图理解医疗真实需求的技术极客，或是探索新商业模式的跨界创业者。

AI医疗的终局，或许不是某个巨型平台的垄断，而是在AI这个协作枢纽的连接下，形成一个更为动态、多元、韧性的新生态。

这条路注定需要耐心与匠心。我们愿做那只沉默的穿山甲，用每一次精准的挖掘，去证明：打通一座山的价值，远大于呼喊移走一万座山。

医路漫漫，与君相伴，穿山而行。