AI智能体开发日报 | 行业动态

AI智能体开发日报 | 行业动态 | 2026年6月25日

今天AI行业有三条信号值得开发者关注：字节豆包从免费走向付费，Agent能力正式成为产品卖点；GPT-5.6即将发布，上下文窗口扩到150万tokens，长任务自主执行成为核心竞争力；Hermes Agent近30天GitHub新增贡献者数量反超OpenClaw，AI智能体的竞争正从"谁有更多工具"转向"谁更懂自学"。

豆包专业版上线：Agent任务执行成为付费卖点

6月24日，字节跳动旗下豆包正式发布专业版，基于最新豆包2.1系列大模型，标准套餐连续包月68元。

这个定价本身不算太意外，但专业版的能力结构才是重头戏。它接入豆包2.1 Pro模型，提供专门的"办公任务模式"——这不是简单的对话框，而是能执行Agent任务的完整环境：操作本地电脑、使用浏览器、调用Skills技能、设置定时任务。

一句话概括：豆包把Agent能力打包成了付费产品。

具体来看，专业版包含内置Office办公套件、专业图片视频设计和生成分享应用网站等能力。标准套餐的专家模式、办公任务模式等功能额度是免费版的5倍以上。同时豆包还推出了大学生专属特惠，认证后标准套餐低至38元/月，原有免费服务与功能保持不变。

对开发者而言，这个信号的意义在于：当国内最大的AI应用之一把Agent任务执行作为付费功能的卖点时，说明市场已经过了"Agent能不能用"的阶段，进入"Agent值不值得为它单独付费"的判断期。68元的定价策略也比较聪明——比ChatGPT Plus便宜，但功能更贴近中国用户的办公场景。

GPT-5.6月底发布：长任务自主执行是核心升级

OpenAI的GPT-5.6预计6月28日正式发布，核心目标是从文字问答工具升级成能自主操作设备的全能智能体。

几个关键参数：上下文窗口扩容至150万tokens，对比上代提升43%；单位token算力损耗降低10%到15%。定价策略上，业内预估GPT-5.6的token单价仅为Claude Fable5的三分之一。

但真正让开发者关注的，是两个实测反馈备受期待的能力：原生3D视觉复刻和内置Playwright自动化工具。前者让模型能理解三维空间结构，后者直接赋予模型操控浏览器的原生能力——不是通过插件，而是内置的。

结合同期微软Copilot Cowork计划引入DeepSeek V4作为分层备选模型的消息来看，一个趋势正在成形：高端闭源模型专注复杂推理，性价比模型处理日常任务，智能分层路由系统自动调度。对开发者来说，未来用AI写代码、处理数据、管理流程的成本会进一步降低，但同时对模型选择和任务路由的架构设计能力要求更高。

Hermes贡献者反超OpenClaw：Agent进入自学技能时代

根据开源智能体增长追踪平台ClawCharts的GitHub数据，Nous Research推出的Hermes Agent，近30天新增贡献者数量已反超OpenClaw。

截至6月24日，Hermes Agent的GitHub Star数已达到201947，MIT开源协议。6月24日当天就有至少6个合并PR，包括工具schema验证、mkdtemp OSError修复、delegate_task上下文隔离修复、DuckDuckGo搜索超时保护等关键改进。

Hermes和OpenClaw的核心差异在于skill的学习方式。OpenClaw需要用户手动编写skill操作指南，告诉Agent每一步该怎么做。Hermes则能自动生成skill——当完成涉及超过五次以上工具调用的复杂任务，或在多次失败后找到可行方案时，系统会自动把这套流程记录下来，变成可复用的操作指南。

用个更直观的说法：OpenClaw需要你说"我已经这么操作了很多次，帮我把它变成操作手册"，而Hermes会在你反复操作的过程中自己学会，下次遇到类似任务直接调取。

这个差异看似细节，实际上指向了Agent发展的一个关键分水岭：从被动接受指令到主动学习工作流。目前Hermes背后的Nous Research自2023年成立以来已获得7000万美元融资，投资方包括Paradigm、OSS Capital和Distributed Global。同期英伟达的NemoClaw也以21387 Star加入竞争，定位是在NVIDIA OpenShell中更安全地运行Agent。

微信"小微"灰度测试：系统级AI助手的想象力

微信悄悄上线了原生AI助手"小微"的限量灰度测试。支持文字或语音直接操控微信原生功能，包括调起小程序、帮好友发消息、查朋友圈、预约服务等。

"小微"拥有系统级权限，能直接解构并执行复杂指令。底层模型结合了微信自研的中文大语言模型WeLM和DeepSeek。这相当于把微信从聊天工具升级成了智能助手入口。

对开发者而言，小微的灰度测试释放了一个重要信号：微信生态的AI化不是浅层集成，而是从系统权限层面打通。如果这个测试跑通，未来通过微信触达用户的方式可能会发生根本变化——不是推送卡片，而是直接帮用户在微信内完成任务。

短讯三则

京东发布国内首个智能体自主支付协议A2P2（Agent Autonomous Payment Protocol），通过分级授权、三重身份核验、资金隔离三大设计，规范AI Agent自主完成购物和支付行为的流程。这是国内首次在Agent自主交易领域出台标准化协议。

小米开源Miloco 2.0全屋智能AI方案，以Agent形式接入OpenClaw，实现智能家居从"语音遥控"到"能记忆、会识人、懂执行"的升级。OpenAI Codex更新macOS版本，上线录制回放功能，用户演示一遍操作流程即可自动生成可复用的自动化技能。

今天的行业信号可以概括为一条主线：AI Agent正在从概念验证走向产品化落地，从被动执行走向主动学习。对开发者来说，现在是一个值得深入投入Agent开发的时间窗口——工具链趋于成熟，商业模式开始跑通，而市场远未饱和。