AI智能体,开始干活了

我上周在Claude Code里开了三个窗口。

一个写前端，一个调后端，还有一个在改文档。

它们同时运行，互不干扰，像一支真正的开发小队。

说实话，我当时的第一反应是：这玩意儿终于不是玩具了。

AI智能体正在从“能聊天”变成“能干活”。

但问题来了。

你让一个AI去写代码，它写得挺好。你让它去P张图、付个款、调用个外部服务试试？

卡住了。

不是AI不够聪明，是它缺胳膊少腿——缺那些能让它在真实世界里“动手”的基础设施。

我拆解了一下最近看到的几个工具，发现一个趋势：海外正在疯狂给AI智能体“装手脚”。

而国内，还在卷大模型参数。

• • •

🧠 先给AI一个“脑子”：Cloudflare的推理层

Cloudflare你肯定知道，做CDN的。

但它最近搞了个新东西，叫AI Platform。

这个平台的核心定位很有意思：专为智能体设计的推理层。

什么意思？

普通的AI云服务，给你算力，给你模型，你爱怎么用怎么用。

但智能体的工作模式很特殊——它要处理长上下文，要做多步骤推理，要频繁调用工具。

Cloudflare直接从基础设施层面开始优化这些场景。

我打个比方。

以前是给你一块空地，你自己盖房子。现在是直接给你一栋为“团队协作”设计好的办公楼，网线、会议室、白板全配齐。

国内对AI云的讨论，还停在“算力够不够”“模型强不强”。

但真正的瓶颈，往往不在模型本身，而在它怎么被调用、怎么协作、怎么持久化运行。

Cloudflare这一步，是把智能体当成了下一代互联网的“原生应用”来设计基础设施。

它不再是一个附加功能，而是核心服务。

• • •

💳 再给AI一张“信用卡”：Agent Card

这是最让我觉得“未来已来”的一个。

Agent Card，简单说，就是给AI智能体用的预付费虚拟Visa卡。

当你的AI需要代表你去订个酒店、买个软件、支付一个API调用费用时，支付授权是个大问题。

你不能把自己的信用卡密钥直接丢给AI。

Agent Card解决了这个。

它设定好额度，限定好商户类型，然后交给AI去操作。

这是一个非常具体、且刚需的“AI-Agent经济基础设施”。

想象一下：

你的旅行规划智能体，查完机票酒店，直接帮你下单支付。

你的内容创作智能体，发现需要某个付费图库的素材，自己买完直接用。

甚至，未来可能有“AI服务市场”，智能体之间互相购买服务，用Agent Card结算。

国内几乎没人讨论这个。

我们还在纠结“AI能不能取代客服”，人家已经在给AI发工资卡了。

差距不在技术，在想象力。

• • •

🖥️ 最后给AI一个“远程桌面”：Astropad Workbench

这个需求极其细分，但刚性到不行。

很多开发者为了省钱，会在云端租用没有图形界面的“无头”服务器来跑AI智能体。

便宜，性能也好。

但一旦你的智能体需要操作图形软件——比如用Photoshop修个图，用Final Cut剪个视频——就傻眼了。

没屏幕，没图形界面，怎么操作？

Astropad Workbench就是干这个的。

它让运行在云端无头Mac上的AI智能体，能像真人一样远程操作图形软件。

你可以理解为，给AI配了一个虚拟的“手”和“眼睛”。

这个工具的出现，说明AI智能体的应用场景已经具体到“工种”级别了。

它不再只是处理文本和代码。

它要开始碰那些传统上被认为“需要人类审美和手感”的领域了。

而这一切，需要专门的基础设施来支撑。

• • •

👥 让AI们“组团”干活：Claude Code桌面版

回到开头我用的那个场景。

Claude Code最近的桌面版大更新，核心就一个：支持并行运行多个编码智能体。

以前你只能和一个AI对话，让它干完A再干B。

现在你可以同时开好几个窗口，每个窗口一个智能体，分工协作。

前端智能体写页面，后端智能体写接口，测试智能体写用例。

它们共享项目上下文，但各司其职。

这不就是一个小型开发团队吗？

国内对Claude Code的讨论，大多还停留在“它代码写得好不好”。

但这种“并行化”“团队化”的协作模式，才是真正释放生产力的关键。

单个AI再强，也有瓶颈。让多个AI协同，复杂度是指数级上升的——但能解决的问题，也是指数级增长的。

• • •

🔧 所以，怎么用起来？

我知道，看到这里你可能觉得：“这些工具很酷，但跟我有什么关系？”

说实话，大部分普通用户现在确实用不上Agent Card或者无头服务器。

但背后的逻辑，你可以立刻借鉴。

AI智能体要真正有用，必须给它“赋能”——不是喊口号那种赋能，是实实在在的能力扩展。

我自己的做法是，在现有工具里，尽量模拟这种“智能体工作流”。

比如，我用Cursor时，会明确给AI分配角色：“你现在是前端专家，只负责React组件，用这个设计稿。”

然后用另一个会话说：“你现在是API工程师，根据这个需求文档写Node.js接口。”

虽然它们本质是同一个模型，但通过角色限定和上下文隔离，模拟了分工。

再比如，涉及到需要“动手”的操作（比如整理文件、批量重命名），我会先用AI生成具体的操作步骤，然后用Zapier或者Mac的Automator去自动化执行。

核心思路是：让AI做决策和规划，让自动化工具去执行。

现阶段，这就是普通人的“智能体基础设施”。

• • •

🚀 国内外的差距，不在模型

拆完这几个工具，我有一个很强烈的感受。

国内大模型在benchmark上的分数，追得很快。

但在“如何让AI真正融入工作流，变成生产力”这件事上，思考的深度和落地的速度，有代差。

我们关注“百模大战”，关注“上下文长度又破了纪录”。

他们关注“我的AI怎么才能自己付钱”“我的AI怎么才能操作Photoshop”。

这是“技术驱动”和“需求驱动”的区别。

也是“追逐热点”和“解决真问题”的区别。

我们得考虑一点：用户要的不是最先进的AI，而是敢用的AI。

好用，意味着它得能连接到你真实的工作环境，能操作你熟悉的工具，能完成那些具体、琐碎、但耗时的任务。

这需要一整套生态，不是光有一个聪明的大脑就够了。

• • •

💡 你的下一步

如果你是个开发者，我建议你立刻去试试Claude Code的并行模式。

感受一下多个AI智能体协作的节奏。哪怕只是让一个写代码，一个写注释，效率提升都是肉眼可见的。

如果你不是开发者，但想用AI提升效率，可以思考这个问题：

你工作中最重复、最耗时、但又不得不做的“动手”环节是什么？

是整理报表？是下载素材？是跨平台同步信息？

先别想着让AI完全自动化。想想怎么让AI帮你生成明确的执行清单，然后你用现有工具（哪怕就是鼠标键盘）去执行。

先跑通这个“AI规划，人执行”的循环。

下一步，才是用自动化工具替代掉“人执行”那部分。

AI取代你不是问题。

你对AI能做什么一无所知，才是问题。

它早就不只是个聊天机器人了。

它正在被装上信用卡、远程桌面和协作工作台，变成一个能替你干脏活累活的数字员工。

而你要做的，是学会当它的老板。