Twitter 联合创始人、金融科技公司 Block(原 Square)CEO Jack Dorsey 在内部推动的组织重构,被 Diana 概括为一句话。若公司本身可查询、artifact 丰富、对 AI 可读,中间便几乎不再需要”人形管道”。与之对应,Diana 提出公司中将只保留三种角色,即个体贡献者(IC)、对结果负责的人(DRI),以及创始人本人。这套三角色模型有其逻辑上的优雅,也有显而易见的盲点。中层管理长期被低估,他们并非仅是信息路由,还承担着另一些难以自动化的职能,比如吸收下属的情绪震荡,将模糊的上级指令翻译成可执行事项,在冲突中为各方保留体面,在坏消息面前保护下属,在跨职能博弈中充当缓冲器。一个 agent 可以合成 sprint 报告,却无法对一位被否掉方案的工程师说:”这次不是你的问题,我去跟产品团队沟通。”当中层被移除,这些职能并不会消失,只会上浮。要么落回 IC 身上,迫使他们同时承担执行与组织协调;要么落到创始人的头上,使其成为整个公司唯一的情绪熔炉与判断中枢。token 可以任意扩展,判断力却不能;创始人的认知带宽是一种真实、有限、会被耗竭的资源。当判断中枢收敛到一个人,这个人的职责便不再是经营,而是架构。创始人每日需要重新回答的四个问题,本质上都是架构问题。对客户承诺什么、商业模式如何成立,这是公司的接口;做什么与明确不做什么,这是公司的边界;产品与用户在我们的抽象中是什么模样,这是公司的领域模型;如何及时发现自己走偏,这是公司的测试策略。无一可以被 agent 代替。极限编程(XP)与测试驱动开发(TDD)的提出者 Kent Beck 那句”每天都要投资于系统设计”,至此才真正落到了公司层面。Diana 自己对此其实有所意识。她在分享中强调,”你不能外包你对这些工具的信念,你必须亲自花时间与 agent 相处,直到它们打破你关于能建什么的固有预设”。这句话通常被读作一种号召—创始人应懂 AI。更准确的读法是,在一家没有中间层的 AI-native 公司里,创始人的品味、对 agent 的使用深度、对优秀产品的感知阈值,直接决定整个组织的上限。这是单点故障,而且是不可替代的单点故障。
把组织做深,而不是做薄
AI-native 公司存在两种可能的组织形态。第一种是”薄组织”,各项职能被切得极细,每个人、每个 agent 都对外暴露大量接口,彼此互相对接;任何改动都需穿越七八个交接点,每个节点单看尚属合理,整体已无人能看清。第二种是”深组织”,若干条边界清晰、职责厚重的流并排运行,每条流对外只承诺一件事,即”负责什么结果、交付什么产物”,内部则吸收全部复杂度。金庸笔下独孤求败在剑冢刻下”重剑无锋,大巧不工”八字,讲的正是同一种取舍—真正厉害的不是精巧花哨的浅接口,而是重到让你不必再在接口层反复搏斗的深结构。薄组织像浮在水面的一片叶子,深组织像钉入地下的一根桩。AI 将两种形态间的差距进一步放大。在薄组织中,agent 的改动散布各处,每个节点都需由人逐一验证,创始人被迫审查每一条路径。这不是”用 AI 加速”,而是替自己多开一份 PR review 的兼职。在深组织中,创始人只需在每条流的接口层把关,流内部则可部分授权给 agent。将 agent 作为灰盒使用的前提,是组织本身先做成灰盒。这正是 Stanford 计算机科学家 John Ousterhout 在《软件设计的哲学》中反复强调的取舍,把复杂度藏进去,只暴露一个简单接口。代码适用,组织更甚。差距亦可被量化。一项流传较广的估算显示,一位将 AI 工具栈搭建得当的 solo 创始人,产出是完全手工方式的 4 至 5 倍。这一乘数的前提是每一层工具之间能相互喂入数据,客户邮件中的 bug 报告经 Claude 摘要后直接进入 Cursor,推送后 Row 自动记账。同一来源中还有一句常被跳过的警告,”AI 运行成本会偷偷涨起来,如果产品没被搭对的话”。放大倍率与失控成本,是同一枚硬币的两面。组织亦是同构。做成深组织,放大生效;做成薄组织,成本失控。中间没有缓冲带。Diana 建议尽可能减少 DM 与 email,将所有沟通嵌入 agent 可访问的渠道,令每一项重要动作都留下 artifact。这一建议在逻辑上是完美的,实践中却有副作用。当所有对话都会被索引、被回看、被喂入 agent,人的坦率程度会下降。思考所需要的那种未完成、不严谨、试探性的对话,会被挤到若干极小的、未被记录的缝隙中。半成形的判断往往在私下的 DM、午餐闲聊、某人深夜发给自己的 draft 中逐渐成熟。一旦这些缝隙被彻底抹平,组织表面上变得 AI 可读,实际的判断质量却在悄然退化。一家可查询的公司,不等于一家会思考的公司。artifact 密集度高,不等同于对问题的理解深。借用 Goodhart 的说法:一旦一项指标成为目标,它便不再是好指标。一旦”产出 artifact”成为隐含的绩效要求,员工会学会生产漂亮却空洞的 artifact,agent 会学会从中提炼出同样漂亮却空洞的结论。整条闭环可以很快速、很自洽,也可以彻底失准。
从第零天开始的五条纪律
将规范评审视作一级工作,而非”写完便交给 agent”。规范评审所占的时间不应少于代码评审,凡未经严肃质询的规范,将在下游被 agent 放大为代价高昂的错误。此条是对 specs to company 叙事的直接对冲。
保留一条不可被 AI 代劳的反馈回路。创始人每周至少与三位真实客户直接对话,不经 agent 摘要,不看汇总报告;每月至少查阅一次原始的取消使用日志;每季度至少通读一遍用户在第三方平台上的负面评价原文。这些动作反直觉地低效,却是整条闭环抵御自欺的唯一防线。此条与 Blank “get the heck outside”一句本质相通。
回到那位花去 47,000 美元、耗时 18 个月最终失败的创业者。他在 Reddit 仅留下一行标题与一个”90% AI 创业注定失败”的结论。这类故事在 2026 年的 AI 创业圈中每日都在重演。失败往往并非 AI 工具不够好,而是创业者用 AI 加速了一个方向错误的选择,将 agent 当成替代判断的捷径,而非放大判断的工具。金庸在《神雕侠侣》里为独孤求败写过一段剑冢自述。弱冠之年,持凌厉刚猛的利剑与河朔群雄争锋;三十岁前,用紫薇软剑,因误伤义士不祥,乃弃之深谷;四十岁前,恃重剑无锋、大巧不工横行天下;四十岁后,不滞于物,草木竹石皆可为剑,渐进于无剑胜有剑之境。这四阶段,恰好映照一位 AI-native 创业者须经的四重关口。利剑阶段的创始人事事亲自执剑,代码自己写,会议自己开,客户自己见。这套功夫在前 AI 时代是立身之本,到了 AI 时代却很快变成拖累。单人带宽的绝对上限,就是公司的上限。软剑阶段是另一种极端。创始人把所有事交给 agent,把业务目标写成规范后便撒手,指望 specs to company 替自己运转公司。紫薇软剑”误伤义士不祥”的教训在这里几乎一字不改地复现,规范没错、测试通过,产出却早已偏离目标,等到财务报表暴露时已晚了一两个季度。软剑必须被”弃之深谷”。重剑阶段才是真正能支撑规模化的形态。深模块化的组织、被严肃评审过的规范、锚定真实世界的反馈回路,全部压进一个简单接口之下。重剑无锋,大巧不工,不靠每一处的花哨去解决问题,而是靠厚重本身碾过去。无剑阶段是这条路径的真正终点。当判断力本身足够锋利,草木竹石皆可为剑。agent 是工具,规范是工具,dashboard 是工具,API 也可以是工具。用什么工具不再重要,什么工具都能为我所用。代码不会因 AI 而变便宜,公司亦不会因 agent 而变容易。稀缺只是换了个位置,从擅长执行,变为擅长提问、擅长验证、擅长忍住不自欺。能走到无剑阶段的创业者,才有资格谈什么AI-native。其余大多数,不过是以更快的速度,尝试撞向同一堵墙的痛感。2026 年 4 月 28 日扩展阅读:AI 时代,代码从未如此昂贵