AI Agent 正在从聊天工具变成自动化员工:Codex 和 Claude Code 都在抢这条路
大家好,我是 Kryon,这是我的第 141 篇原创。
这两周 AI 编程工具有个变化很明显:它们不再满足于“你问一句,它答一句”。
Codex 和 Claude Code 都在往同一个方向卷:从聊天工具,变成自动化员工。
以前我们评价 AI 编程工具,主要看它会不会写代码、改 bug、跑测试。现在不一样了。真正值得看的问题变成了:它能不能自己接任务、自己触发、自己执行,再把结果带回工作流。
这件事比单纯模型升级更重要。
先说结论
如果你把“自动化员工”理解成云端定时干活,Claude Code 更像。
如果你把“自动化员工”理解成能进入你的电脑、浏览器、插件和本地应用,Codex 更像。
Claude Code 更像云端值班工程师,Codex 更像坐在你电脑旁边的执行助理。
这两条路线不一样,但都指向同一个终点:AI 不再只是对话框,而是工作流里的执行节点。

Claude Code 抢的是固定岗位
Claude Code 最近最关键的能力是 Routines。
它的核心不是“聊天时更聪明”,而是你可以把一段任务配置好,让它按条件醒来干活。
这个条件可以是定时,可以是 API 调用,也可以是 GitHub 事件。
这就很像固定岗位。
你可以让它:
-
• 每天检查仓库里的高优先级 bug -
• PR 打开后自动做代码审查 -
• 发布后跑一轮回归检查 -
• 定期整理 issue 和变更记录 -
• 接 GitHub webhook 后自动处理任务
这个方向非常工程化。
它解决的不是“我现在问你一个问题”,而是这个任务以后反复出现,你能不能替我盯着。
这就很员工。
Codex 抢的是工作现场
Codex 走的是另一条路。
它不只待在代码仓库里,而是开始进入你的电脑现场。
Computer Use、插件、浏览器、自动化、记忆,这几个能力拼在一起,指向的不是一个更强的聊天窗口,而是一个能操作工作流的执行助理。
它可以看页面、点按钮、输入内容、打开本地应用,也能通过插件接进更多工具。
这意味着 Codex 的边界不再只是代码。
它可以参与:
-
• 浏览器验证 -
• 前端页面检查 -
• 本地应用操作 -
• 文档和设计稿处理 -
• GitHub、Slack、Linear 这类工具流转 -
• 长线程任务跟进
这条路更宽,但也更难。
因为它不是只要把代码写对就行。它要理解你的工作现场,还要在各种应用之间少犯错。
真正的分水岭
以前 AI 工具的核心问题是:
它能不能回答我?
现在问题变成:
它能不能在我不盯着的时候,把事往前推?
这个变化很关键。
聊天工具的上限,是降低你的思考成本。
自动化员工的上限,是降低你的执行成本。
两者差很多。
你问它怎么优化页面,它回答你,这是聊天工具。
你让它每天检查性能回归,发现问题后开 PR,这是自动化员工。
你让它读取任务、整理资料、操作浏览器、验证结果、把进展反馈给你,这就更接近真实工作流。

谁现在更实用
如果你现在最想解决的是工程自动化,Claude Code Routines 更直接。
它适合:
-
• 仓库任务 -
• 定时检查 -
• PR 审查 -
• GitHub 事件触发 -
• 云端长期执行
它的边界清楚,任务明确,适合做重复工程流程。
如果你想让 AI 进入更广的工作现场,Codex 更值得盯。
它适合:
-
• 本地应用操作 -
• 浏览器验证 -
• 插件联动 -
• 多工具协作 -
• 长线程任务跟进
它现在更像一个还在学习的执行助理,但岗位范围更大。
我的判断
短期看,Claude Code 更像成熟的云端值班工程师。
它能把固定任务挂起来,按触发条件执行,这对工程团队很实用。
长期看,Codex 的想象空间更大。
因为真正的自动化员工,不只是会处理仓库,也要能进入你的电脑、文档、浏览器、设计稿、消息工具和各种业务系统。
这也是为什么我觉得 Codex 这次路线更值得长期观察。
它不只是让 AI 更会写代码。
它是在把 AI 从聊天窗口往工作现场里推。
最后
AI Agent 的下一阶段,不是更会回答问题。
而是更会接任务。
谁能稳定接任务、触发任务、执行任务、交付结果,谁就更接近真正的自动化员工。
Codex 和 Claude Code 现在抢的,其实就是这条路。
如果你也在折腾 AI Agent、Codex、Claude Code 和自动化工作流,后面我会继续把这些实测过程整理出来。
夜雨聆风