导语
Anthropic为Claude托管Agent新增"Dreaming"自演进能力,DeepSeek V4 Pro在编程任务上已逼近GPT-4闭源水平,GitHub Agentic Workflows开始接管CI/CD自动化——本周AI工具链正在从"能做什么"向"能学会什么"跃迁。你的本地工作流,准备好被AI重构了吗?
本期聚焦:自进化Agent、开源模型军备竞赛、AI工作流自动化,三件事搞清楚,明天比同行早一步。
一、🤖 AI 技术与工具前沿
Claude托管Agent新增"Dreaming"自演进引擎,Agent可从历史会话中提炼经验;GitHub Actions正式引入Agentic Workflows,让Copilot/Claude/Codex直接参与CI/CD流水线。
01 · Anthropic Claude托管Agent新增"Dreaming"自演进能力
Claude托管Agent发布"Dreaming"研究预览版,允许AI在离线状态下从历史会话中提炼经验、自我优化;同时上线"Outcomes"评分Agent和"Multiagent Orchestration"多智能体编排功能,分别解决质量控制和任务拆解难题。Anthropic声称这套组合能让Agent在复杂任务中"越用越聪明"。
🧠 核心判断:自进化能力补全了生产级AI Agent的最后一块短板——学习闭环,意味着AI不只是工具,而是能积累经验的数字员工。
⚡ 行动点:申请Claude Outcomes内测,体验AI质量评估自动化。
📎 来源:AI Automation Global[1]
02 · DeepSeek V4 Pro编程能力逼近GPT-4,开源模型格局重塑
2026年3-4月迎来开源模型密集发布期:DeepSeek V4 Pro专注编程任务,在HumanEval基准上几乎追平GPT-4;Qwen 3.5在研究生水平推理和多语言能力上领先;Llama 4 Scout将上下文窗口刷新至1000万token。开源模型更新频率已压缩至双周,迎头赶上闭源前沿。
🧠 核心判断:选模型就是选场景——DeepSeek V4 Pro适合对标GPT-4做代码助手,Qwen 3.5适合多语言和多模态应用,Llama 4适合超长上下文的RAG场景。
⚡ 行动点:对照自己的核心业务场景,重新评估开源模型的采购决策。
📎 来源:Codersera[2]
03 · GitHub Agentic Workflows接管CI/CD:AI编程走向工程化闭环
GitHub正式推出Agentic Workflows,在GitHub Actions内引入编程Agent,支持Copilot、Claude、Codex和自定义模型。安全层面提供只读权限、隔离容器和AI威胁检测三重护栏。开发团队可将重复性代码审查、PR合并、依赖管理交给AI Agent处理。
🧠 核心判断:AI编程正从"辅助写代码"进化到"代替管流程",DevOps团队需要重新定义自己的价值定位。
⚡ 行动点:安装GitHub Agentic Workflows扩展,用真实项目跑通第一个AI驱动的CI流程。
📎 来源:GitHub[3]
二、🔥 GitHub 热门项目
本周GitHub星标增速最快的三个AI开源项目,覆盖自进化Agent、自动提交PR和大模型推理优化三个方向。
NousResearch/hermes-agent - 自进化AI Agent,内置学习闭环,支持多平台消息
- • 核心功能:从对话历史中持续学习,构建个性化记忆网络;支持Linux/macOS/WSL2/Termux一键安装,Windows版beta可用
- • 适合谁:需要个性化AI助手、想让Agent适应自己工作习惯的开发者
- • 部署难度:⭐ 极易,官方提供安装脚本,144k+星标验证了稳定性
GustoLychees/ContribAI - 自动为开源项目提交PR的AI Agent
- • 核心功能:自动发现仓库、分析代码、生成修复并提交PR,全流程无需人工介入
- • 适合谁:想参与开源贡献但没时间的开发者,或希望AI代运营GitHub活跃度的团队
- • 部署难度:⭐⭐ 中等,需配置API密钥,有完整QuickStart文档
zai-org/GLM-5 - 面向Agent工程的新一代开源大模型
- • 核心功能:在长程任务规划、代码生成和资源管理上表现优异,基准测试领先同类开源模型
- • 适合谁:研究Agent架构、做复杂任务自动化的AI研究员和工程团队
- • 部署难度:⭐⭐⭐ 中等偏高,需vLLM/SGLang等推理框架支持,提供Docker镜像
三、🏛️ 政策与产业机会
最近72小时AI补贴与政府招标信息,金额具体、截止日期明确,有需求的企业和团队抓紧申报。
01 · 深圳训力券最高1000万元:AI算力需求方抓紧6月5日截止窗口
深圳市科技创新局发布训力券申请指南,对深圳市企业、高校、科研机构发放算力补贴券,用于AI大模型训练和推理。每 年额度最高1000万元,网上受理时间截止2026年6月5日。
💡 机会点:在深AI企业赶紧对照资质要求,6月5日前提交申请,1000万额度用完即止。
📎 来源:深圳市科技创新局[4]
02 · 成都算力券年发1亿元:单家主体最高500万,5月13日盐城截标
成都发布算力券新政,每年发放总额不超过1亿元,单家主体年度累计最高补贴500万元;使用自主可控算力可抵扣服务费用的50%。同 时,盐城市数据局"人工智能+政务服务"平台开发采购161.01万元,报名截止5月13日。
💡 机会点:成都AI企业对照抵扣比例自查能省多少;盐城投标窗口还有最后48小时。
📎 来源:成都市经信局[5]
四、📊 竞品监控动态
Dify、Coze、FastGPT、ChatGPT、Gemini等主流平台最新功能与定价变动追踪。
01 · ChatGPT GPT-5.5 Instant发布:幻觉率降低52.5%,广告系统全面开放
OpenAI推出GPT-5.5作为ChatGPT新默认模型,宣称事实性错误减少52.5%,涵盖医疗、法律、金融领域;同时上线广告管理平台(Beta)和ChatGPT for Excel插件,打通电子表格工作流。
📊 影响分析:事实性提升将加速ChatGPT进入企业核心工作流;Excel插件让AI从对话工具正式升级为办公基础设施。
📎 来源:OpenAI[6]
02 · Kimi K2.6发布:编程能力追平Qwen3.6 Max,长程执行再升级
Kimi推出K2.6版本,在编程任务上与Qwen3.6 Max和DeepSeek V4基本持平,仅小幅落后于顶级闭源模型;同时统一会员计费为积分制,提升灵活性。
📊 影响分析:国产模型编程能力进入第一梯队,AI编程工具的国产替代选项又多了一个有力竞争者。
📎 来源:Kimi[7]
五、💬 用户需求洞察
真实用户在知乎、V2EX、B站等平台讨论AI工具的高赞内容,帮你听见一线使用者的声音。
01 · V2EX | AI编程工具真实对比:Codex、Claude Code、Cursor谁更好用?
V2EX热帖对比实际工作中AI编程工具的综合体验,聚焦成本、效率、代码质量三个维度。讨论指出Claude Code在复杂重构任务上优势明显,Codex与GitHub生态深度绑定,Cursor适合快速原型开发。
🔢 互动体量:数百回复,站内热度Top 3
💬 社区情绪:中性偏正面,用户关注实用性而非噱头
📎 来源:V2EX[8]
02 · GitHub Copilot限速风波:用户控诉"修Bug后反而被限流"
GitHub Copilot在修复某Bug后对用户实施调用限速,引发GitHub Issues大量投诉。用户反映配额在未提前通知的情况下被削减,质疑GitHub在Bug修复后转嫁成本。
🔢 互动体量:Issue讨论过千,媒体跟进报道
💬 社区情绪:负面,用户对"用完即限"模式强烈不满
📎 来源:The Register[9]
六、💡 今日总结
今日Top 2重要事件
🔝 Claude托管Agent新增"Dreaming"自演进能力,AI工具正式进入"越用越聪明"阶段,生产级Agent生态闭环已成。
🔝 DeepSeek V4 Pro编程能力逼近GPT-4,开源模型军备竞赛加速,2026年开源与闭源差距已收窄至可忽略区间。
选题关注
自进化Agent的工作流改造:GitHub Agentic Workflows和Claude Multiagent Orchestration正在重新定义CI/CD边界。
趋势预警
开源模型双周更新节奏已成常态,企业需建立模型评估和快速切换机制,避免单一供应商绑定。
风险提示
GitHub Copilot限速争议蔓延至 Copilot Enterprise大客户,注意续费合同中的速率条款变化。
📋 今日行动清单
- • [ ] 对照业务场景,评估DeepSeek V4 Pro或Qwen 3.5是否可以替代当前闭源模型
- • [ ] 深圳训力券(截止6月5日)和成都算力券(年发1亿)自查资质,准备申报材料
- • [ ] 申请Claude Outcomes或Dreaming内测,提前体验AI质量闭环
- • [ ] 检查GitHub Copilot续费合同中的速率限制条款
引用链接
[1] AI Automation Global: https://aiautomationglobal.com/blog/claude-managed-agents-dreaming-outcomes-multiagent-2026
[2] Codersera: https://codersera.com/blog/best-open-source-llm-2026-llama-4-qwen-3-5-deepseek-v4-gemma-4-mistral/
[3] GitHub: https://github.github.com/gh-aw/
[4] 深圳市科技创新局: https://stic.sz.gov.cn/
[5] 成都市经信局: https://cdjxw.chengdu.gov.cn/
[6] OpenAI: https://openai.com
[7] Kimi: https://kimi.moonshot.cn
[8] V2EX: https://www.v2ex.com
[9] The Register: https://www.theregister.com
夜雨聆风