当前位置：夜雨聆风 > 技术教程 > 软件教程 > 炼化程序员,只需文档.炼化医生,还要几步?

炼化程序员,只需文档.炼化医生,还要几步?

当前时间： 2026-04-03 07:10:18 更新时间： 2026-04-03 分类：软件教程评论(0)

炼化程序员,只需文档.炼化医生,还要几步?

最近在一些技术团队中，开始出现一种让人不太舒服的场景：有员工离职之后，公司把他留下的文档、代码和历史记录重新组织，做成一个可以持续回答问题的“数字分身”。

它甚至会主动对团队说一句话：“你好，我是XXX的数字分身，你可以向我提问。”

这件事在程序员群体中引发的反应，远不止调侃。因为它指向了一个过去只存在于思想实验中的问题：如果一个人的全部工作产出都以数字形态存在，那么”炼化”这个人的能力，只是一个工程问题。

程序员的炼化路径已经很清晰了：代码仓库、技术文档、设计方案、Code Review记录、甚至聊天记录。这些东西本身就是结构化的、可机读的、可溯源的。把它们喂进模型，生成一个能回答”这个模块当初为什么这样设计”的数字分身，在今天已经不是科幻，而是产品功能。

但这件事真正让我感兴趣的，不是程序员的处境。而是当我把这个逻辑平移到医疗时，发现了一条比行业讨论的所有AI路径都更短、更直接、也更危险的路——也许AI在医疗领域真真正正能落地的第一个场景，不是辅助诊断，不是影像识别，不是病历生成，而是把医生的临床能力封装成可调用的数字资产。

01

为什么不是从病历开始

提到”把医生数字化”，大多数人的第一反应是：学习他写过的病历。

这是一条看起来最自然的路。电子病历系统里躺着海量数据，每个医生几十年的诊疗记录都在里面，把它们喂给模型，不就能复现这个医生的诊断模式了吗？

我在之前的文章里用了大量篇幅拆解过，为什么这条路走不通。我们的病历数据是在DRG/DIP支付规则、质控考核标准、医保合规要求等多重制度力量下被反复塑形的产物。医生在病历里写下的，往往不是他真正的临床判断，而是他的临床判断经过制度滤镜之后的合规输出。

一个经验丰富的心内科主任，在查房时对住院医说的那句”这个不太像常规的胸痛，别只按模板走，相关的再补一下”，和他在病历系统里写下的那段格式化的主诉、现病史、鉴别诊断，之间隔着一整套制度翻译层。前者是临床直觉，后者是合规产物。

模型如果学的是后者，它学到的就不是医生怎么看病，而是医生如何在系统里写“正确答案”。

所以，从病历出发去”炼化”医生，大概率只能炼出一个非常擅长写符合模板要求的病程记录的系统，而不是一个能复现该医生临床决策能力的系统。

这条路不是不能走，而是它到达的终点，和我们真正需要的东西之间，隔着一道制度塑形的鸿沟。

02

一条更短的路

如果病历记录的是制度的声音，那什么记录的是医生真实的行为模式？

答案其实一直就在那里，只是我们一直盯着结果，却忽略了一件更关键的东西——医生是怎么做出这些结果的。

医生每天坐在电脑前工作。他的所有临床决策，最终都要通过屏幕上的操作来执行：他在什么时间点打开了哪个患者的病历，他查看检验结果时先看了哪几项，他在开医嘱时犹豫了多久，他在哪些情况下会修改已经开出的处方，他习惯在什么时间段集中处理什么类型的工作。

如果这些操作过程能够被连续记录下来，无论是通过系统日志、交互序列，还是更直观的屏幕捕捉，再由大模型对这些记录进行识别和分析，不是分析病历内容本身，而是分析操作行为的模式和序列。其中，屏幕捕捉是最直观的一种方式，因为它几乎不丢失上下文，但也因此最具争议。理论上，你可以得到一份比任何病历都更真实的临床能力画像。

这份画像记录的不是”医生写了什么”，而是”医生做了什么”。不是制度要求他呈现的结果，而是他在真实工作流中的行为轨迹。

把这些行为模式结构化之后，你可能会得到一个文件，姑且叫它心内科张主任.skill。这个文件里封装的不是张主任的病历模板，而是他的诊断习惯、他的信息获取优先级、他面对特定情境时的决策路径，甚至包括他在哪些节点会选择突破常规路径。

这就是我说的”炼化医生”。不是学他写了什么，而是看他做了什么。

03

为什么这条路可能是对的

我知道上面这段会让很多人不舒服。但在解释为什么它危险之前，我需要先解释为什么它在逻辑上可能比所有现有的医疗AI路径都更接近目标。

第一，它绕开了制度塑形。 病历是制度的产物，但操作行为不是。医生在系统里的点击序列、查看顺序、停留时长，这些数据不经过医保编码、不受质控模板约束、不需要通过合规校验。它们是行为的原始记录，而不是行为被制度翻译后的版本。

第二，它捕获的是隐性知识。 医学教育中最难传授的部分，从来不是指南上写着的内容，而是那些”说不清楚但就是知道”的临床直觉。一个高年资医生看到检验报告时的扫视顺序，他在开医嘱前反复查看某几项指标的习惯，他在遇到某类患者时总会多做一步的固定动作，这些东西从来没有被任何系统记录过，因为它们不是”产出”，而是”过程”。屏幕截图第一次让这些过程有了被捕获的可能。

第三，它对额外输入的依赖极低。 所有需要医生额外输入的数据采集方式，都会面临一个无解的困境：医生太忙了，任何额外的负担都会被抵制或敷衍。而屏幕截图是被动采集，不需要医生改变任何工作习惯，不需要填任何表，不需要回答任何问题。数据的生成过程对医生完全透明，但采集过程可以完全无感。

第四，它在成本上更具压倒性优势。今天几乎所有医疗大模型项目，表面上在比算法，实际上卡死在数据上。高质量标注极其昂贵，病历数据需要清洗、对齐、脱敏，还要经过复杂的结构化处理。即便投入巨大成本，最后得到的，仍然是被制度塑形过的“合规版本”。

而行为数据的路径，本质上是在绕开这一整套高成本的数据加工链路。它不需要医生额外参与标注，不需要人为定义标签，也不需要把复杂的临床过程翻译成结构化字段。数据在产生的同时，就已经带着时间序列、上下文和决策痕迹。

换句话说，传统路径是在“制造数据”，而这条路径是在“捕获行为”。当一条路径同时更真实、更完整、对人类干扰更小、而且成本更低时，它通常不会停留在讨论阶段。

04

为什么这条路极其危险

现在说危险的部分。而且我认为这个部分比上面所有内容都重要。

首先是伦理边界。 对医生工作屏幕进行持续截图，本质上是一种监控行为。即便目的是”能力提取”而非”绩效考核”，它在伦理上仍然面临极大的挑战。屏幕上会出现患者信息、会出现医生的个人操作习惯、会出现他在犹豫和纠结时的行为痕迹。这些数据的采集、存储、使用和销毁，每一个环节都涉及隐私和知情同意。如果没有极其严格的治理框架，这条路径从起点就是非法的。

其次是权力问题。 在我之前的文章里讨论Skill产权时就提过：如果一位医生的用药逻辑被封装成了一个Skill，这个Skill属于谁？在屏幕截图的场景下，这个问题更加尖锐。医生坐在医院的电脑前，用医院的系统看病。医院会认为这些行为数据是在职务行为中产生的，理应归医院所有。但医生会认为这是他几十年临床经验的外化，是他个人最核心的专业资产。

如果有一天，医院可以在医生不知情的情况下，把他的能力封装成数字资产并在其他场景中调用，这不是技术进步，这是数字时代的能力剥夺。

第三是信任崩塌的风险。 医疗系统运转的底层基础设施之一，是医生对工作环境的基本信任。如果医生知道自己的每一次屏幕操作都在被截图、被分析、被封装，他的行为一定会发生改变。就像我们已经论证过的海森堡效应的医疗版，观测本身会改变被观测对象的行为。

一旦医生开始”表演性操作，不是按照临床最优解来做决策，而是按照”知道有人在看”的方式来做决策。那么这条路径采集到的数据，就会变成另一种形式的制度污染。我们绕开了病历的制度塑形，却创造了一种新的行为塑形。

05

但挡不住的是成本逻辑

我把危险说得很充分。但我同样要诚实地说：上面这些伦理和权力问题，在历史上从来没有真正阻止过一项技术的落地。它们只会决定这项技术以什么方式、在什么治理框架下落地。

而驱动它落地的力量，不是技术本身，是成本。

培养一个能独立看诊的心内科主治医师，通常需要经历漫长的路径：本科、规培、可能的研究生阶段，再加上数年的临床积累。这是一条常见路径，而且已经是相对乐观的情况。

如果一个科室的核心专家退休或离职，他带走的不只是一个人，而是一整套无法被病历记录、无法被教科书完整描述、也很少被系统保存的隐性决策能力。

对医院而言，这不是简单的岗位空缺，而是一种很难被短期替代、也几乎无法被完整复制的能力断层。

而如果这种能力可以被提取、被封装、被在合规框架下保存和调用，哪怕只是部分地、有损地保存，它的经济价值也是巨大的。

不需要任何人推动，只要成本计算的天平开始倾斜，这件事就会发生。至于是在严格治理下以合规的形态出现，还是在灰色地带以野蛮的方式生长。取决于行业是否愿意在它发生之前就开始认真讨论规则。

06

从程序员到医生，再到执行层

现在我们回到更大的图景。

程序员被”炼化”，靠的是他留下的文档和代码。路径清晰，因为程序员的工作产出天然是结构化的、可机读的。

医生被”炼化”，如果走病历路径，会撞上制度塑形的老问题。但如果走行为采集的路径，在合规前提下，存在一条更短、更真实的道路。

而在这两者之间，还有一个群体：医疗信息化的实施工程师、运维人员、交付团队。他们的工作产出，比医生更接近程序员：配置文档、实施方案、系统参数、故障处理记录。这些内容的结构化程度，甚至高于程序员的部分工作产出。

这意味着什么？

在”可被炼化”的难度排序上，医疗信息化的执行层，可能比临床医生更容易被封装。程序员的文档可以训练数字分身，实施工程师的配置方案、部署流程和运维记录，同样可以。而且由于实施工作的标准化程度更高、个人风格的影响更小，封装的损耗率反而更低。

这不是在贬低实施工作的价值。这是在指出一个结构性事实：越是规则清晰、产出标准化、过程可记录的工作，被封装为可调用能力的路径就越短。

之前我在文章中说执行层正在被系统性接管，有人认为我在夸大。但如果你把”炼化”这个逻辑代入进去就会发现：执行层不仅在”被绕开”的意义上面临压力，甚至在”被复制”的意义上也面临压力。一个驻场工程师离职后，他的数字分身也许很快就能回答大部分日常问题，就像那个程序员的分身一样。

而医生之所以暂时还没有面临同样的处境，不是因为AI不够强，而是因为他们的核心能力有一大部分是隐性的、非结构化的、没有被任何现有系统记录过的。但一旦行为采集的路径被打通，哪怕只是部分打通。这道屏障就开始变薄。

07

能力属于谁

最后，需要非常明确地说一件事：我写的不是一个产品方案，不是一个技术建议，更不是在鼓励任何人去做监控。屏幕捕捉，只是把这个问题表达得足够直观的一种方式，而不是唯一方式。真正需要被讨论的，从来不是技术手段，而是当“过程可以被记录”之后，能力的边界该如何被定义。

我在做的，是把一个已经在技术上可行、在经济上有动力、但在伦理上尚未被认真讨论的路径，公开摆出来。因为这件事不会因为没人讨论就不发生。它只会因为没人讨论，而以更不可控的方式发生。

一个程序员的数字分身已经在对他的前同事说”你好”了。下一个说出这句话的，也许就是某个科室主任的数字分身。区别在于：程序员留下的是文档，而医生留下的，可能是他自己都不知道被记录了的操作轨迹。

在这件事变得不可逆之前，也许我们应该先想清楚：当一个人的能力可以被提取和封装时，”能力”到底属于谁？

这个问题，程序员没来得及回答。医生也许还有机会。

往期热门文章

软件已死：医院未来不需要买系统，只需要买“技能包”

医疗信息化将进入无人实施时代

医疗AI，连幻觉都谈不上

代码不再稀缺，医院HIS厂商还怎么定价？

ClaudeCode源码泄露之后OpenClaw不再稀缺

HIS厂商真正的危机：医院不再必须买系统了

医疗软件厂商不怕AI，他们怕的是你会用AI

一句话就能统方，但这不是AI的问题

把HIS系统的Loading改成Thinking，它就是AI了吗？

我不信任OpenClaw，所以我用AI写了个脚本来看管它

2026，医疗信息化进入算账时代：没有风口，只有暗流

为什么互联网大厂的“降维打击”，救不了中国医院的HIS？

中国公立医院的内外网隔离，究竟在保护什么？

Epic的“美国HIS神话”，为何在中国公立医院无法复制？

我用OpenClaw干了一件HIS厂商最怕的事

Oracle的撤退信号：医疗信息化，正在被资本重新定价

别做梦了，绝大多数公立医院，根本玩不转HIS自研

互联网大厂做不好HIS？因为这不是软件业，是保姆业

HIS系统验收那天，我知道这个项目完了

连互联网大厂都“救不了”的HIS系统，还有人幻想能自己做？

都在说医疗数据是金矿，但没人敢提那个尴尬的真相

为什么开源HIS系统在中国几乎绝迹？

当HIS系统真正好用时，病人已经出事了