当Claude Code推出定时执行的Routines、Chrome允许一键复用AI技能、开发者开始为智能体构建诊断工具——Agentic AI的重心已从“能不能做”转向“能不能稳定地重复做”。
过去几周,行业焦点集中在Agentic模型的能力边界与治理风险上:Anthropic因misuse concerns主动限发Mythos,华尔街将其投入真实压力测试,监管层紧盯其行动能力。但今天,风向悄然变了——“工作流能否被可靠调度”。
真正值得看的是,Agentic AI正在从单次任务演示,进化为可编排、可复现、可监控的routine(例行程序)。这标志着Agent不再是实验性玩具,而开始嵌入真实开发与业务流程。
01 / 先划重点
先划重点
Agentic能力的价值重心正从“一次性能完成复杂任务”转向“能否被稳定调度和重复执行”。 开发者生态已出现围绕routine管理、故障诊断、技能封装的基础设施雏形。 这一转变意味着Agentic AI正从demo阶段迈入workflow阶段,可靠性契约将取代能力上限成为竞争焦点。
02 / 这件事为什么值得看
这件事为什么值得看
1. Claude Code推出Routines功能,支持定时、API触发与GitHub事件响应
Anthropic在Claude Code中上线了Routines功能,允许开发者定义自动运行的代码任务——可按计划调度、响应API调用,或监听GitHub事件。这不是简单的自动化脚本,而是将Agentic推理能力封装为可触发的routine,运行于Anthropic托管的云基础设施上。此举首次将Claude的coding能力从交互式会话延伸至后台持续服务,标志着其从“对话助手”向“可调度智能体”的跃迁。
2. Chrome推出Skills功能,让AI工作流变成一键复用的浏览器原生能力
Google在Chrome中推出Skills功能,允许用户将常用AI prompt保存为可一键调用的工具,并支持remix和共享。这意味着复杂的多步AI workflow可被固化为轻量级技能,在浏览器上下文中直接复用。不同于插件市场中的黑盒工具,Skills强调用户对prompt的掌控与组合自由,本质上是在客户端构建一个可积累、可迁移的Agentic技能库。这为routine的用户侧沉淀提供了新路径。
3. Kelet等诊断工具涌现,专为LLM应用的生产级故障提供根因分析与修复建议
开发者社区已出现如Kelet这类专门面向LLM应用和AI agents的根因分析agent,能持续监控生产环境中的失败案例,并自动生成修复方案。这类工具的出现,说明Agentic系统的不可预测性已成为实际运维痛点。当routine被频繁调用,failure mode的可观测性与可修复性就变得至关重要——这正是从“能跑通一次”迈向“能稳定运行”的关键门槛。
03 / 主编判断
主编判断
今天的变化看似分散,实则指向同一内核:Agentic AI的竞争主战场,正在从模型能力本身,转移到工作流的可调度性与可靠性上。Claude Code的Routines提供了云端调度能力,Chrome Skills构建了用户侧的routine积累机制,而Kelet则试图解决routine失败后的诊断闭环。三者共同构成一个初步但完整的routine生命周期管理栈。
这背后其实是开发者对“Agentic幻觉”的集体反思——再强的reasoning能力,若无法稳定复现,就难以嵌入真实workflow。过去我们关注context length、tool use coverage或planning depth,现在发现,真正的瓶颈在于“能否在明天、下周、下个月依然可靠地执行同一任务”。接下来,应重点关注routine的版本控制、回滚机制、依赖管理以及跨平台调度协议——这些才是Agentic落地的infra层胜负手。
04 / 总结
总结
Agentic AI的下一阶段,不是比谁的模型更能“飞飞机”,而是比谁的工作流更能“准时打卡”。当routine成为基本单元,可靠性契约将取代能力秀场,成为新的信任基石。
关注我们,获取每日 AI 精选资讯
点击下方公众号名片,第一时间获取前沿动态与深度解读。
夜雨聆风