
AI 工具越来越强,但工具不会自动形成系统。
这是过去一段时间,我把自己高强度泡在各类 AI 工具里后,越来越确定的一件事。
一开始,我的目标是寻找更强、更精准的 AI 工具。我配置了个人的 AI 智能体(我管他叫小虾🦐),熬了两个通宵才把它折腾起来。为了让小虾按我的工作流工作,我从"安装现成 Skill"逐渐过渡到"写自用 Skill",最高频的那个叫"入库"。我同时保有 4 家厂商的模型订阅,给他们做了严肃的"职责分工":能力强但贵的专家模型用来解决疑难杂症和重型任务,量大管饱但能力一般的模型是最好用的赛博打工人。
但深入后我越来越意识到——解决需求的关键不在工具本身。
我经常会在开会间隙突然冒出一个想法,或者在路上突然想起一件事要处理,所以"随时记录日程、进度、脑子里冒出来的想法和灵感"对我来说是刚需。但我不可能随时打开笔记软件来进行记录——等我打开 Obsidian,可能想记什么已经忘了。所以一开始,我只想在飞书里发消息给小虾来实现随时记录并生成本地 .md 笔记文件。
我本以为我只需要写一个任务 SOP 流程文档,用"入库"两个字作为触发词,小虾按图索骥执行,就可以实现这个"非常简单"的需求。
但我大错特错。某一次,我跟我的小虾说:"入库,今天我写了一个 B 站视频摘要任务的 SOP 并通过小虾跑通了流程,很高兴。"我只是想把这句话记在我的笔记里,但是我发现我的小虾并没有执行我的入库指令,而是以为我在跟他聊天,并给了我很高的情绪价值:"太好了,我真为你感到高兴"。不止如此,在缺乏上下文的情况下,小虾有时会干脆没意识到这是个专项任务,所以根本没有去翻"SOP 说明书",自然无法执行任务。

其实加一句"请根据 SOP 的指引执行入库任务"的提示词就能解决触发问题,但是即时记录这种高频动作跟在具体内容之前加这句提示词这件事本身就是相悖的。
我必须既要又要:既要简化操作,又要稳定执行。
最后我的解决方案是一套组合拳:把 SOP 流程文档 Skill 化(脚本调用)+ 系统级快捷指令 + IM + 语音录入。虽然这不是理论上最优雅的解法,但已经是我能找到的比较理想的可落地方案。

这时候我才更清楚地意识到:AI 协同真正难的不是"做一次",而是"稳定、可控、可复用地做对"。
模型越强,工具越多,如果人没有把自己的目标、判断和工作流整理出来,AI 反而会把混乱放大。
与其继续追工具,不如蒸馏自己
在系统学习 AI 之前,我总担心有很高的技术门槛。稍微入门之后,我又开始寄希望于找到更强的工具,甚至把希望押在每一次模型版本更新上。
但折腾得越多,我越觉得这个方向有问题。
只要 AI 还需要人用自然语言去调用、去给它提供上下文,说清楚自己要什么的能力,就仍然是最终效果的瓶颈。
所以,与其把"更有效、更高效"的希望完全寄托在工具自身的迭代升级上,不如回过头来做一件更难、也更长期的事情:
蒸馏自己。
我说的"蒸馏自己",不是让 AI 记住一些关于我的资料。它至少有两层意思。
第一层:让 AI 理解我是谁。
举一个我最在意的例子:我会明确告诉 AI"不要默认迎合我"。
我观察到,AI 大语言模型普遍有一种附和用户的默认倾向——不管你说什么它都会先肯定一下,甚至抛弃独立判断。但我用 AI 是为了解决问题,不是为了被夸。我更需要它站在与我不同的视角,给出中立的分析、评估,甚至直接的反驳。
这条偏好如果不写下来,AI 就会用面向最大公约数用户的安全方式和我协作,就算是 ChatGPT 和 Claude 也无法免俗。而我已经不满足于这种协作方式。
第二层:让我的工作流可以叠加生长。
举个例子。我先做了"入库" Skill,让小虾承接我日常的随手记录。在它跑稳之后,我又做了"周报" Skill——它会从我一周的入库内容里挑出值得写进周报的条目,分类、润色、结构化列出,我只需要审阅初稿、做一些修正就可以。
入库 Skill 是周报 Skill 的前置条件。没有入库长期沉淀下来的内容,周报 Skill 就只是个空架子。
这件事让我意识到,蒸馏自己不是一次性把什么定义清楚,而是把一个个原子化的模块沉淀下来,让它们可以彼此叠加、彼此调用。
我相信,通过这种持续生长,我可能会离心里关于"操作系统"这个词的形态越来越近。

但蒸馏自己这件事,本身很难。
我经常以为自己"知道"。
但知道和表达,是两件事。表达和让 AI 稳定理解,又是两件事。
比如,我花了一段时间才意识到:我不喜欢 AI 在回答前先做"关系对齐"——先复述一遍我的判断、表态自己是否认同,然后才进入正题。这件事我心里一直"知道",但要把它精确写下来——不是"别迎合"、不是"直接一点",而是"不要先做关系对齐式回应"——本身就需要一次提炼。
AI 对我而言已经不只是工作搭子,他更像我的参谋和顾问——他不只是给我分析和方案,也在反过来逼我把问题想清楚。
项目开启时,我跟 AI 通常只是表达一个方向性想法。譬如:我想做一个工具,把每周记录的信息抽取出来,自动形成周报。从产品开发的角度看,这只是一个需求,离可用于开发的文档还相去甚远。
但在 Claude Code 的 Plan Mode 里,它会反过来追问我:
从入库素材中提取周报项,范围怎么界定?
每一项素材只说当前进度就行,还是要带上遇到的困难、需要的支持?
如果两条素材指向同一件事,要不要合并?
这些问题的回答,会逼着我把粗糙的想法慢慢转化成真正的产品文档。
还有一个原因,AI 工具迭代太快了。一个工具今天很新,明天可能就被平台功能覆盖;一个工作流今天看起来先进,下一代模型出来之后可能就需要重写。
我自己的小虾就是这样的存在。这种自建的智能体最容易被未来某个新产品直接吃掉。我花两个通宵把它搭起来跑顺,但很清楚它绝非终点。
所以我越来越关心那些不容易快速贬值的东西——问题怎么定义、工作流怎么搭、自己的判断怎么沉淀、skill 之间怎么叠加。这些东西不完全依附于某个模型,也不完全依附于某个平台。
EthanOS 想做的事不是追上每一个新工具,而是建设一套可以吸收、调度、替换新工具的底层系统。
EthanOS 是一个长期愿景
EthanOS 不是我现在已经完成的项目,它更像一座灯塔。
它在远方提醒着我,不要只追逐下一个工具,不要把希望都押在某个模型或平台的升级上,而是逐渐把自己的目标、判断和工作流建设成一套个人操作系统。
我不想写那种"再不学 AI 只会面临被淘汰"的文章,焦虑很好制造,但没什么建设性。AI 时代已经够吵了,不差我再敲一面锣。
EthanOS 更像是一份纪实,它是一个长期面临复杂决策环境的实践者,逐渐寻找与 AI 协作方式的真实纪录。不一定是标准答案,但会尽量记下当下实感。
如果你也在做类似的尝试,希望 EthanOS 能成为你前行路上的一盏小灯。
最后,说一个周末早上的故事
一个周末的早上,我打开 ChatGPT,敲下了一段现在回看挺粗糙的话:
讨论一个 vibe coding 的产品构想:目前网易云音乐的 mac 客户端极其难用,因为太重了,非常卡。我想做一个接网易云 API、重做前端 UI(非常轻)的个人电台,仅本地使用。你怎么看?
当时她还不叫 Floe,没有图标,没有代码,连一份像样的需求都算不上。更接近一句带方向的抱怨。

我对网易云的使用其实很单一——只听私人 FM。我想要的就是一块漂浮在桌面角落的小东西,安静、轻、不抢注意力,打开就能播。
围绕这个气质,我砍掉了几乎所有能砍的功能。她无法搜索歌曲,连上一首的按钮都没有。她只能做一件事:登录我的网易云账号,播放我的私人 FM。
然后是大量精密的调试——画布多大、中英文字体怎么搭配、暗色背景里要不要加一道很弱的边缘泛光。
现在 Floe 被我固定在程序坞里,每天打开。她真的存在了——可以打开,可以用,安安静静待在那儿。
EthanOS 想纪录的,就是这种故事。
夜雨聆风