乐于分享
好东西不私藏

炼化程序员,只需文档.炼化医生,还要几步?

炼化程序员,只需文档.炼化医生,还要几步?

最近在一些技术团队中,开始出现一种让人不太舒服的场景:有员工离职之后,公司把他留下的文档、代码和历史记录重新组织,做成一个可以持续回答问题的“数字分身”。

它甚至会主动对团队说一句话:“你好,我是XXX的数字分身,你可以向我提问。”

这件事在程序员群体中引发的反应,远不止调侃。因为它指向了一个过去只存在于思想实验中的问题:如果一个人的全部工作产出都以数字形态存在,那么”炼化”这个人的能力,只是一个工程问题。

程序员的炼化路径已经很清晰了:代码仓库、技术文档、设计方案、Code Review记录、甚至聊天记录。这些东西本身就是结构化的、可机读的、可溯源的。把它们喂进模型,生成一个能回答”这个模块当初为什么这样设计”的数字分身,在今天已经不是科幻,而是产品功能。

但这件事真正让我感兴趣的,不是程序员的处境。而是当我把这个逻辑平移到医疗时,发现了一条比行业讨论的所有AI路径都更短、更直接、也更危险的路——也许AI在医疗领域真真正正能落地的第一个场景,不是辅助诊断,不是影像识别,不是病历生成,而是把医生的临床能力封装成可调用的数字资产。

01

为什么不是从病历开始

提到”把医生数字化”,大多数人的第一反应是:学习他写过的病历。

这是一条看起来最自然的路。电子病历系统里躺着海量数据,每个医生几十年的诊疗记录都在里面,把它们喂给模型,不就能复现这个医生的诊断模式了吗?

我在之前的文章里用了大量篇幅拆解过,为什么这条路走不通。我们的病历数据是在DRG/DIP支付规则、质控考核标准、医保合规要求等多重制度力量下被反复塑形的产物。医生在病历里写下的,往往不是他真正的临床判断,而是他的临床判断经过制度滤镜之后的合规输出。

一个经验丰富的心内科主任,在查房时对住院医说的那句”这个不太像常规的胸痛,别只按模板走,相关的再补一下”,和他在病历系统里写下的那段格式化的主诉、现病史、鉴别诊断,之间隔着一整套制度翻译层。前者是临床直觉,后者是合规产物。

模型如果学的是后者,它学到的就不是医生怎么看病,而是医生如何在系统里写“正确答案”。

所以,从病历出发去”炼化”医生,大概率只能炼出一个非常擅长写符合模板要求的病程记录的系统,而不是一个能复现该医生临床决策能力的系统。

这条路不是不能走,而是它到达的终点,和我们真正需要的东西之间,隔着一道制度塑形的鸿沟。

02

一条更短的路

如果病历记录的是制度的声音,那什么记录的是医生真实的行为模式?

答案其实一直就在那里,只是我们一直盯着结果,却忽略了一件更关键的东西——医生是怎么做出这些结果的。

医生每天坐在电脑前工作。他的所有临床决策,最终都要通过屏幕上的操作来执行:他在什么时间点打开了哪个患者的病历,他查看检验结果时先看了哪几项,他在开医嘱时犹豫了多久,他在哪些情况下会修改已经开出的处方,他习惯在什么时间段集中处理什么类型的工作。

如果这些操作过程能够被连续记录下来,无论是通过系统日志、交互序列,还是更直观的屏幕捕捉,再由大模型对这些记录进行识别和分析,不是分析病历内容本身,而是分析操作行为的模式和序列。其中,屏幕捕捉是最直观的一种方式,因为它几乎不丢失上下文,但也因此最具争议。理论上,你可以得到一份比任何病历都更真实的临床能力画像。

这份画像记录的不是”医生写了什么”,而是”医生做了什么”。不是制度要求他呈现的结果,而是他在真实工作流中的行为轨迹。

把这些行为模式结构化之后,你可能会得到一个文件,姑且叫它心内科张主任.skill。这个文件里封装的不是张主任的病历模板,而是他的诊断习惯、他的信息获取优先级、他面对特定情境时的决策路径,甚至包括他在哪些节点会选择突破常规路径。

这就是我说的”炼化医生”。不是学他写了什么,而是看他做了什么。

03

为什么这条路可能是对的

我知道上面这段会让很多人不舒服。但在解释为什么它危险之前,我需要先解释为什么它在逻辑上可能比所有现有的医疗AI路径都更接近目标。

第一,它绕开了制度塑形。 病历是制度的产物,但操作行为不是。医生在系统里的点击序列、查看顺序、停留时长,这些数据不经过医保编码、不受质控模板约束、不需要通过合规校验。它们是行为的原始记录,而不是行为被制度翻译后的版本。

第二,它捕获的是隐性知识。 医学教育中最难传授的部分,从来不是指南上写着的内容,而是那些”说不清楚但就是知道”的临床直觉。一个高年资医生看到检验报告时的扫视顺序,他在开医嘱前反复查看某几项指标的习惯,他在遇到某类患者时总会多做一步的固定动作,这些东西从来没有被任何系统记录过,因为它们不是”产出”,而是”过程”。屏幕截图第一次让这些过程有了被捕获的可能。

第三,它对额外输入的依赖极低。 所有需要医生额外输入的数据采集方式,都会面临一个无解的困境:医生太忙了,任何额外的负担都会被抵制或敷衍。而屏幕截图是被动采集,不需要医生改变任何工作习惯,不需要填任何表,不需要回答任何问题。数据的生成过程对医生完全透明,但采集过程可以完全无感。

第四,它在成本上更具压倒性优势。今天几乎所有医疗大模型项目,表面上在比算法,实际上卡死在数据上。高质量标注极其昂贵,病历数据需要清洗、对齐、脱敏,还要经过复杂的结构化处理。即便投入巨大成本,最后得到的,仍然是被制度塑形过的“合规版本”。

而行为数据的路径,本质上是在绕开这一整套高成本的数据加工链路。它不需要医生额外参与标注,不需要人为定义标签,也不需要把复杂的临床过程翻译成结构化字段。数据在产生的同时,就已经带着时间序列、上下文和决策痕迹。

换句话说,传统路径是在“制造数据”,而这条路径是在“捕获行为”。当一条路径同时更真实、更完整、对人类干扰更小、而且成本更低时,它通常不会停留在讨论阶段。

04

为什么这条路极其危险

现在说危险的部分。而且我认为这个部分比上面所有内容都重要。

首先是伦理边界。 对医生工作屏幕进行持续截图,本质上是一种监控行为。即便目的是”能力提取”而非”绩效考核”,它在伦理上仍然面临极大的挑战。屏幕上会出现患者信息、会出现医生的个人操作习惯、会出现他在犹豫和纠结时的行为痕迹。这些数据的采集、存储、使用和销毁,每一个环节都涉及隐私和知情同意。如果没有极其严格的治理框架,这条路径从起点就是非法的。

其次是权力问题。 在我之前的文章里讨论Skill产权时就提过:如果一位医生的用药逻辑被封装成了一个Skill,这个Skill属于谁?在屏幕截图的场景下,这个问题更加尖锐。医生坐在医院的电脑前,用医院的系统看病。医院会认为这些行为数据是在职务行为中产生的,理应归医院所有。但医生会认为这是他几十年临床经验的外化,是他个人最核心的专业资产。

如果有一天,医院可以在医生不知情的情况下,把他的能力封装成数字资产并在其他场景中调用,这不是技术进步,这是数字时代的能力剥夺。

第三是信任崩塌的风险。 医疗系统运转的底层基础设施之一,是医生对工作环境的基本信任。如果医生知道自己的每一次屏幕操作都在被截图、被分析、被封装,他的行为一定会发生改变。就像我们已经论证过的海森堡效应的医疗版,观测本身会改变被观测对象的行为。

一旦医生开始”表演性操作,不是按照临床最优解来做决策,而是按照”知道有人在看”的方式来做决策。那么这条路径采集到的数据,就会变成另一种形式的制度污染。我们绕开了病历的制度塑形,却创造了一种新的行为塑形。

05

但挡不住的是成本逻辑

我把危险说得很充分。但我同样要诚实地说:上面这些伦理和权力问题,在历史上从来没有真正阻止过一项技术的落地。它们只会决定这项技术以什么方式、在什么治理框架下落地。

而驱动它落地的力量,不是技术本身,是成本。

培养一个能独立看诊的心内科主治医师,通常需要经历漫长的路径:本科、规培、可能的研究生阶段,再加上数年的临床积累。这是一条常见路径,而且已经是相对乐观的情况。

如果一个科室的核心专家退休或离职,他带走的不只是一个人,而是一整套无法被病历记录、无法被教科书完整描述、也很少被系统保存的隐性决策能力。

对医院而言,这不是简单的岗位空缺,而是一种很难被短期替代、也几乎无法被完整复制的能力断层。

而如果这种能力可以被提取、被封装、被在合规框架下保存和调用,哪怕只是部分地、有损地保存,它的经济价值也是巨大的。

不需要任何人推动,只要成本计算的天平开始倾斜,这件事就会发生。至于是在严格治理下以合规的形态出现,还是在灰色地带以野蛮的方式生长。取决于行业是否愿意在它发生之前就开始认真讨论规则。

06

从程序员到医生,再到执行层

现在我们回到更大的图景。

程序员被”炼化”,靠的是他留下的文档和代码。路径清晰,因为程序员的工作产出天然是结构化的、可机读的。

医生被”炼化”,如果走病历路径,会撞上制度塑形的老问题。但如果走行为采集的路径,在合规前提下,存在一条更短、更真实的道路。

而在这两者之间,还有一个群体:医疗信息化的实施工程师、运维人员、交付团队。他们的工作产出,比医生更接近程序员:配置文档、实施方案、系统参数、故障处理记录。这些内容的结构化程度,甚至高于程序员的部分工作产出。

这意味着什么?

在”可被炼化”的难度排序上,医疗信息化的执行层,可能比临床医生更容易被封装。程序员的文档可以训练数字分身,实施工程师的配置方案、部署流程和运维记录,同样可以。而且由于实施工作的标准化程度更高、个人风格的影响更小,封装的损耗率反而更低。

这不是在贬低实施工作的价值。这是在指出一个结构性事实:越是规则清晰、产出标准化、过程可记录的工作,被封装为可调用能力的路径就越短。

之前我在文章中说执行层正在被系统性接管,有人认为我在夸大。但如果你把”炼化”这个逻辑代入进去就会发现:执行层不仅在”被绕开”的意义上面临压力,甚至在”被复制”的意义上也面临压力。一个驻场工程师离职后,他的数字分身也许很快就能回答大部分日常问题,就像那个程序员的分身一样。

而医生之所以暂时还没有面临同样的处境,不是因为AI不够强,而是因为他们的核心能力有一大部分是隐性的、非结构化的、没有被任何现有系统记录过的。但一旦行为采集的路径被打通,哪怕只是部分打通。这道屏障就开始变薄。

07

能力属于谁

最后,需要非常明确地说一件事:我写的不是一个产品方案,不是一个技术建议,更不是在鼓励任何人去做监控。屏幕捕捉,只是把这个问题表达得足够直观的一种方式,而不是唯一方式。真正需要被讨论的,从来不是技术手段,而是当“过程可以被记录”之后,能力的边界该如何被定义。

我在做的,是把一个已经在技术上可行、在经济上有动力、但在伦理上尚未被认真讨论的路径,公开摆出来。因为这件事不会因为没人讨论就不发生。它只会因为没人讨论,而以更不可控的方式发生。

一个程序员的数字分身已经在对他的前同事说”你好”了。下一个说出这句话的,也许就是某个科室主任的数字分身。区别在于:程序员留下的是文档,而医生留下的,可能是他自己都不知道被记录了的操作轨迹。

在这件事变得不可逆之前,也许我们应该先想清楚:当一个人的能力可以被提取和封装时,”能力”到底属于谁?

这个问题,程序员没来得及回答。医生也许还有机会。

往期热门文章

软件已死:医院未来不需要买系统,只需要买“技能包”

医疗信息化将进入无人实施时代

医疗AI,连幻觉都谈不上

代码不再稀缺,医院HIS厂商还怎么定价?

ClaudeCode源码泄露之后OpenClaw不再稀缺

HIS厂商真正的危机:医院不再必须买系统了

医疗软件厂商不怕AI,他们怕的是你会用AI

一句话就能统方,但这不是AI的问题

把HIS系统的Loading改成Thinking,它就是AI了吗?

我不信任OpenClaw,所以我用AI写了个脚本来看管它

2026,医疗信息化进入算账时代:没有风口,只有暗流

为什么互联网大厂的“降维打击”,救不了中国医院的HIS?

中国公立医院的内外网隔离,究竟在保护什么?

Epic的“美国HIS神话”,为何在中国公立医院无法复制?

我用OpenClaw干了一件HIS厂商最怕的事

Oracle的撤退信号:医疗信息化,正在被资本重新定价

别做梦了,绝大多数公立医院,根本玩不转HIS自研

互联网大厂做不好HIS?因为这不是软件业,是保姆业

HIS系统验收那天,我知道这个项目完了

连互联网大厂都“救不了”的HIS系统,还有人幻想能自己做?

都在说医疗数据是金矿,但没人敢提那个尴尬的真相

为什么开源HIS系统在中国几乎绝迹?

当HIS系统真正好用时,病人已经出事了