更准确一点说,是公司终于开始认真给 AI 补制度了。
过去一年,行业最喜欢聊的是模型更强了、Agent 更能跑了、视频和 3D 更像真的了。
这些当然还在继续。OpenAI 往前推 o3-pro,Google 给 Gemini 加 thinking budgets,MiniMax 压视频流程,腾讯混元继续把 3D 世界往外放。
但昨天更有劲的,不是能力表又往上抬了一格,而是越来越多消息开始回答同一个现实问题:这玩意进了公司以后,谁来定价,谁来分权限,谁来打分,谁来担责。
TRAE Work、NotebookLM、Cursor Evals、Tokei、FrontierCode、Google AI Overviews 的责任裁定,再加上融资、算力和基础设施这些消息,一起把这件事照得特别清楚。
AI 现在不只是一个能干活的工具了。
它开始像一个要进组织、进流程、进考核、进责任链的新角色。
昨天真正的变化,不是 AI 更会做事了,而是公司开始补上那套以前还没来得及给它的制度。
01|第一件被补上的,是预算制度,AI 先得学会按表走
实验项目可以靠热情推进,正式系统不行,正式系统先看的永远是预算。
所以昨天我最在意的,不是 o3-pro 本身有多强,而是推理能力这件事越来越像一种可以被采购、被控量、被计价的资源。
Gemini 把 thinking budgets 摆出来,这件事尤其说明问题。它不只是告诉你模型会想,而是告诉你这次打算让它想多久、花多少、值不值。
这和以前那种只追求更强答案的感觉完全不同。以前我们看的是能力天花板,现在公司更关心的是同样一件事,它的成本曲线能不能被管住。
MiniMax 那种把视频流程压成一句话跑完的 Agent,也是在往这个方向走。因为一旦一个多步骤流程被收成一个动作,它就天然会进入另一本账,这次省了多少人手,这次多花了多少算力,这次能不能批量复用。
腾讯混元把 3D World Model 往外放,同样会很快遇到这个门槛。3D 世界生成一旦开始碰仿真、内容生产和空间交互,下一步一定不是“哇,好强”,而是“每跑一次多少钱,能替代几步流程”。
所以昨天第一层真正的变化,是 AI 开始学会按预算表走路了。
从这一刻起,它就不再只是技术问题,它会变成财务问题、运营问题和制度问题。

02|第二件被补上的,是权限制度,AI 不能再站在系统外面了
因为一个东西只要真的开始干活,公司马上就会追问,它到底能看什么,能动什么,能接什么。
TRAE Work 这类产品昨天最让我在意的,不是功能多,而是姿态变了。它不是再做一个聪明聊天框,而是明显在争正式协作入口。文档、表格、图片、页面、小应用、自动任务,再加上模型配置、额度、知识库、沙箱和审计,这套东西不是做给围观者看的,是做给组织接入看的。
NotebookLM 继续往 Gemini 体系里收,也是同样的信号。资料、问答、沉淀、继续协作都被尽量放到一条线里,这其实就是权限边界在收口。
以前很多 AI 产品像临时顾问,问完就走,不碰系统核心。现在越来越多产品开始反过来想,我能不能干脆坐进系统里,成为这个组织内部的一部分。
但一旦坐进去,事情就没那么浪漫了。
因为权限制度会立刻跟上。谁能接文档,谁能看知识库,谁能碰生产数据,谁能执行动作,谁必须走审批,这些以前可以模糊的地方,都会被一条条补出来。
所以昨天第二层变化,不是 AI 更会协作了,而是公司终于开始问,它有没有资格协作。

03|第三件被补上的,是考核制度,AI 干完活以后还得有人验收
这也是为什么昨天 FrontierCode 这种基准那么刺耳。它不是那种跑几百道题目的排行榜,而是把结果端到真实维护者面前,问一句,这玩意你敢不敢合并。
这一下就把很多华丽叙事拉回地面了。因为真正的门槛,从来不是“像不像答案”,而是“能不能进入正式系统”。
Cursor Evals 和 Tokei 这种东西也一样。把 token、成本、步骤、过程轨迹和结果评估摆到台面上,听起来没那么性感,但这恰恰说明公司开始认真给 AI 建考核制度了。
以前一个 AI 跑偏了,大家会说没事,试试看。现在不一样了。现在它如果进的是代码、文档、内容生产、研究支持和自动执行,团队就一定会问,谁来复盘,谁来审,谁来记录,谁来改下一次的规则。
Claude Code 那句提醒我觉得特别准,关键不只是它有没有把事情做对,而是它是不是在做对的事情。
这句话一出来,AI 的角色就彻底变了。它不再只是一个能生成结果的工具,而是一个要被纳入绩效、复盘和质检体系的执行单元。
所以昨天第三层变化,不是 AI 更稳定了。
而是公司先把评价它的尺子补出来了。

04|第四件被补上的,是责任制度,AI 的错不能再飘在空中
德国法院把 Google AI Overviews 视作谷歌自己的表达,要求谷歌对错误内容直接承担责任,这种裁定很重,因为它把平台原来那种“我只是展示一下结果”的缓冲区压缩掉了。
这其实特别像所有公司马上都会碰到的问题。只要 AI 继续往搜索、办公、生产和服务现场里走,出错以后责任不可能永远悬着,总要落到某个公司、某个团队、某个法务主体头上。
同一天,Apollo 和 Blackstone 那种大额 AI 融资、全国数据中心投资、芯片限制、轨道算力方案这些消息一起出来,也是在补另一种责任,谁来投,谁来供,谁来保,谁来扛长期成本。
到这一步,AI 就已经不再像一个单独产品经理能拍板的小功能了。
它开始像一层真正的基础设施,被预算、法务、监管、产业链和组织治理一起盯着看。
所以你会发现,昨天最重要的变化不是某个模型又刷了新分数,而是越来越多人开始围着 AI 这张桌子坐下来。
有人带预算表,有人带权限清单,有人带评分规则,有人带判例和风控条款。
这就是昨天第四层变化,AI 终于不只是被拿来干活了,它开始被要求对自己的后果负责。

所以回到昨天这组 AI 热点,我觉得最值得记住的,不是 AI 又比昨天聪明了多少。
而是公司终于开始一张表一张表地给它补制度了。
先补预算,再补权限,再补考核,最后补责任。
这几张表一补上,AI 才算真的从演示台走进组织里。
昨天真正收紧的,不是能力边界。
而是制度边界。
如果你们团队接下来真的准备把 AI 当成正式角色接进来,你觉得最该先补的,是预算规则、权限规则、考核规则,还是责任规则?
🔥 今日话题|如果让你今天就给 AI 立第一条制度,你会先立哪一条?
👇 点个「在看」,转给那个已经在用 AI 干活,但还没来得及给它补规矩的人。
夜雨聆风