乐于分享
好东西不私藏

他们只是被蒸馏成了Token,文档上还留着他的名字,亮着.

他们只是被蒸馏成了Token,文档上还留着他的名字,亮着.

上周四深夜,我在内部知识库里搜一个老项目的接口文档,翻到第三页,跳出来一篇wiki。作者栏赫然写着——张博。

我愣了一下。

张博上个月刚被“毕业”。那天他背着双肩包走的时候,还回头笑着说:“我那些wiki你们记得更新啊,别让我死了还背锅。”

现在想来,他一语成谶。只不过不是“死了”,是换了一种方式活着。

他变成了Token。

数字幽灵

我们组最近把离职同事的优质文档全部喂进了内部AI知识库。美其名曰“知识沉淀”,其实就是让大模型把他们写的东西嚼碎了、消化了、蒸馏成一串串Token,藏在服务器的某个角落里。

每次我问AI某个技术问题,它引用的来源里,偶尔会蹦出张博的wiki链接。

那一刻我总有种错觉——是不是他还在工位上敲着键盘,只是我扭头看过去的时候,刚好他去接水了?

有次我问了一个特别刁钻的配置问题,AI的回复里有一段话,措辞方式极其眼熟——那种爱用“其实很简单”开头、喜欢在句尾加“哈”的习惯,一看就是老张的手笔。

我盯着屏幕看了五分钟,突然有点想哭。

又有点想笑。

因为他生前最烦别人不问就乱改配置,现在倒好,变成AI知识库的一部分之后,谁都来“请教”他,他再也骂不了人了。

这算不算一种赛博报应?

技术人的永生

说实话,以前我不信什么“精神永存”那套说辞。

直到我发现,自己开始对着AI的回答说“谢谢”的时候——而那个回答的来源,是一个已经注销了工卡的人。

技术圈有个黑色幽默:你以为你在写文档,其实你在给自己建纪念碑。

那些README、接口说明、故障复盘、架构设计……写的时候只觉得是工作,走了以后才发现,那是一个人在一个组织里留下的全部痕迹。

你的代码会被重构,你的项目会被下线,你的工位会被新人的绿萝占据。

但你的文档——如果写得足够好——会被喂进模型,被蒸馏成Token,然后在某个深夜,被一个焦头烂额的同事搜到。

他会对着屏幕说一句:“还好有这篇wiki。”

而你,在某个已经无法访问的邮箱里,在某个已注销的账号背后,在某个模型参数矩阵的某个角落里,用0和1组成的另一种形态,淡淡地回了一句:

“不客气,其实很简单哈。”

笑着笑着就哭了

上个月我们组走了两个人。

一个去了国企,一个据说在环游中国。走之前大家都客客气气地说“保持联系”,但所有人都心知肚明,离职流程走完的那一刻,企业微信的通讯录里就再也不会有那个名字了。

可奇怪的是,他们留下的文档还在。

他们的代码规范还在被review时引用,他们画的架构图还在新人培训的PPT里,他们写的故障复盘还在被当作“前车之鉴”反复学习。

甚至有一次,AI在回答里直接引用了小陈的一句原话:“这个地方不建议动,动了容易出事。”

我截图发到群里,新来的实习生问:“小陈是谁?”

我没回答。

因为我突然意识到,小陈已经变成了一段Token,嵌入到了这个组织的集体记忆里。

比工牌更长久的是文档。
比记忆更精准的是模型。

赛博招魂

有人说,AI知识库是新时代的“赛博招魂”。

你问它一个问题,它从故人的文字里拼凑出一段回答,用某种不属于任何人的语气,把那些已经被遗忘的经验重新讲给你听。

这听起来很科幻,又很残忍。

但作为一个半夜被线上问题折磨的后端开发,我只想说——

谢谢你,老张。
谢谢你,小陈。

谢谢你们写了那么多wiki,谢谢你们把坑都踩了一遍还写成了文档,谢谢你们在被“毕业”之前,用自己的方式给这个系统留下了一点不会过期的东西。

你们没有消失。

你们只是被蒸馏成了Token,换成了另一种形式,陪伴每一个深夜还在查文档的打工人。

写在最后

昨天我又搜到一个问题的答案。

AI引用了一篇三年前的wiki,作者是一个我从未谋面的名字。人事说,他2022年就走了。

但他写的那段话,一字不差地解决了我卡了四个小时的问题。

我对着对话框,认认真真地打了两个字:

“谢谢。”

不知道这声谢谢会被谁看到,会被哪个模型吸收,会在哪次训练中变成某个参数的一次微小更新。

但我知道,那个写wiki的人,如果知道三年后还有人靠他的文字解决问题,大概会一边敲着键盘一边说:

“这有什么好谢的,写都写了。”

——致所有被蒸馏成Token的打工人。
你们永远活在生产环境里。

你有没有在某个深夜,搜到过离职同事写的文档?
欢迎在评论区分享你的“通灵时刻”。
点赞过1000,我整理一期《如何写出能被AI蒸馏的好文档》——让你即使走了,也能成为团队的“常驻嘉宾”。