
今天AI行业有三条信号值得开发者关注:字节豆包从免费走向付费,Agent能力正式成为产品卖点;GPT-5.6即将发布,上下文窗口扩到150万tokens,长任务自主执行成为核心竞争力;Hermes Agent近30天GitHub新增贡献者数量反超OpenClaw,AI智能体的竞争正从"谁有更多工具"转向"谁更懂自学"。
豆包专业版上线:Agent任务执行成为付费卖点
6月24日,字节跳动旗下豆包正式发布专业版,基于最新豆包2.1系列大模型,标准套餐连续包月68元。
这个定价本身不算太意外,但专业版的能力结构才是重头戏。它接入豆包2.1 Pro模型,提供专门的"办公任务模式"——这不是简单的对话框,而是能执行Agent任务的完整环境:操作本地电脑、使用浏览器、调用Skills技能、设置定时任务。
一句话概括:豆包把Agent能力打包成了付费产品。
具体来看,专业版包含内置Office办公套件、专业图片视频设计和生成分享应用网站等能力。标准套餐的专家模式、办公任务模式等功能额度是免费版的5倍以上。同时豆包还推出了大学生专属特惠,认证后标准套餐低至38元/月,原有免费服务与功能保持不变。
对开发者而言,这个信号的意义在于:当国内最大的AI应用之一把Agent任务执行作为付费功能的卖点时,说明市场已经过了"Agent能不能用"的阶段,进入"Agent值不值得为它单独付费"的判断期。68元的定价策略也比较聪明——比ChatGPT Plus便宜,但功能更贴近中国用户的办公场景。

GPT-5.6月底发布:长任务自主执行是核心升级
OpenAI的GPT-5.6预计6月28日正式发布,核心目标是从文字问答工具升级成能自主操作设备的全能智能体。
几个关键参数:上下文窗口扩容至150万tokens,对比上代提升43%;单位token算力损耗降低10%到15%。定价策略上,业内预估GPT-5.6的token单价仅为Claude Fable5的三分之一。
但真正让开发者关注的,是两个实测反馈备受期待的能力:原生3D视觉复刻和内置Playwright自动化工具。前者让模型能理解三维空间结构,后者直接赋予模型操控浏览器的原生能力——不是通过插件,而是内置的。
结合同期微软Copilot Cowork计划引入DeepSeek V4作为分层备选模型的消息来看,一个趋势正在成形:高端闭源模型专注复杂推理,性价比模型处理日常任务,智能分层路由系统自动调度。对开发者来说,未来用AI写代码、处理数据、管理流程的成本会进一步降低,但同时对模型选择和任务路由的架构设计能力要求更高。
Hermes贡献者反超OpenClaw:Agent进入自学技能时代
根据开源智能体增长追踪平台ClawCharts的GitHub数据,Nous Research推出的Hermes Agent,近30天新增贡献者数量已反超OpenClaw。
截至6月24日,Hermes Agent的GitHub Star数已达到201947,MIT开源协议。6月24日当天就有至少6个合并PR,包括工具schema验证、mkdtemp OSError修复、delegate_task上下文隔离修复、DuckDuckGo搜索超时保护等关键改进。
Hermes和OpenClaw的核心差异在于skill的学习方式。OpenClaw需要用户手动编写skill操作指南,告诉Agent每一步该怎么做。Hermes则能自动生成skill——当完成涉及超过五次以上工具调用的复杂任务,或在多次失败后找到可行方案时,系统会自动把这套流程记录下来,变成可复用的操作指南。
用个更直观的说法:OpenClaw需要你说"我已经这么操作了很多次,帮我把它变成操作手册",而Hermes会在你反复操作的过程中自己学会,下次遇到类似任务直接调取。
这个差异看似细节,实际上指向了Agent发展的一个关键分水岭:从被动接受指令到主动学习工作流。目前Hermes背后的Nous Research自2023年成立以来已获得7000万美元融资,投资方包括Paradigm、OSS Capital和Distributed Global。同期英伟达的NemoClaw也以21387 Star加入竞争,定位是在NVIDIA OpenShell中更安全地运行Agent。

微信"小微"灰度测试:系统级AI助手的想象力
微信悄悄上线了原生AI助手"小微"的限量灰度测试。支持文字或语音直接操控微信原生功能,包括调起小程序、帮好友发消息、查朋友圈、预约服务等。
"小微"拥有系统级权限,能直接解构并执行复杂指令。底层模型结合了微信自研的中文大语言模型WeLM和DeepSeek。这相当于把微信从聊天工具升级成了智能助手入口。
对开发者而言,小微的灰度测试释放了一个重要信号:微信生态的AI化不是浅层集成,而是从系统权限层面打通。如果这个测试跑通,未来通过微信触达用户的方式可能会发生根本变化——不是推送卡片,而是直接帮用户在微信内完成任务。
短讯三则
京东发布国内首个智能体自主支付协议A2P2(Agent Autonomous Payment Protocol),通过分级授权、三重身份核验、资金隔离三大设计,规范AI Agent自主完成购物和支付行为的流程。这是国内首次在Agent自主交易领域出台标准化协议。
小米开源Miloco 2.0全屋智能AI方案,以Agent形式接入OpenClaw,实现智能家居从"语音遥控"到"能记忆、会识人、懂执行"的升级。OpenAI Codex更新macOS版本,上线录制回放功能,用户演示一遍操作流程即可自动生成可复用的自动化技能。
今天的行业信号可以概括为一条主线:AI Agent正在从概念验证走向产品化落地,从被动执行走向主动学习。对开发者来说,现在是一个值得深入投入Agent开发的时间窗口——工具链趋于成熟,商业模式开始跑通,而市场远未饱和。
夜雨聆风