导语
谷歌I/O 2026发布Gemini Spark 24/7自主Agent,阿里Qwen3.7-Max在自研芯片上自主运行35小时实现10倍加速,腾讯开源四层Agent记忆系统——AI Agent正从"被动问答"跨越到"主动执行"。这三条主线同时出现,意味着什么?
本期聚焦:自主执行、企业部署、算力补贴。三件事搞清楚,明天比同行早一步。
🤖 AI 技术与工具前沿
本周Agent自主化能力密集突破:从芯片优化到记忆系统,从24/7后台运行到视频生成Agent,AI正从"能用"走向"能干活"。
01 · 阿里Qwen3.7-Max自主运行35小时,芯片代码优化10倍加速
阿里通义千问发布Qwen3.7-Max,专为自主Agent任务设计,仅通过API提供。在真实测试中,该模型在阿里自研T-Head-ZW-M890加速器上自主运行35小时,执行432次内核测试和1158次工具调用,实现平均10倍性能加速。对比竞品:GLM 5.1仅达7.3x、Kimi K2.6达5x、DeepSeek V4 Pro仅3.3x。该模型还被用作训练"看门狗",自主检测训练过程中的作弊行为,编写13条新检测规则、标记1618个案例。
🧠 核心判断:自主Agent不再是Demo——35小时无人干预的工程级任务,标志着AI从辅助编程进入独立交付阶段。10x加速远超竞品,自研芯片+自研模型的垂直整合正在形成壁垒。
⚡ 行动点:评估Qwen3.7-Max API在你现有Agent工作流中的表现,关注Aliyun Model Studio的企业接口
📎 来源:The Decoder[1]
02 · Google I/O发布Gemini Spark:24/7个人AI Agent,关电脑也不停
Google I/O 2026发布Gemini Spark——基于Gemini 3.5 Flash和Antigravity框架的云端Agent,即使关闭电脑/手机也能持续在后台执行任务。支持设置循环任务、教授新技能、创建工作流;深度集成Gmail/Docs/Slides等Workspace工具;即将通过MCP连接Canva、OpenTable、Instacart等第三方服务。Ultra订阅价从$200降至$100/月,测试版下周向美国Ultra用户开放。
🧠 核心判断:Google将Agent定义为"24/7云端数字助手",与竞品桌面端Agent形成差异化。$100/月的定价锚定了"Agent订阅制"这一全新商业模式,将倒逼全行业跟进。
⚡ 行动点:如果你是Google Workspace重度用户,申请Gemini Spark测试资格;非Google生态用户关注同类竞品跟进节奏
📎 来源:Google Blog[2]
03 · 腾讯开源TencentDB Agent Memory:四层记忆管道,Token用量降61%
腾讯开源了TencentDB Agent Memory,一个面向AI Agent的四层本地记忆系统。架构核心理念:将对话历史蒸馏为原子事实→场景→角色,形成金字塔式长期记忆。实测集成OpenClaw后,WideSearch通过率从33%提升至50%,Token使用量降低61.38%。支持Gateway适配器接入Hermes Agent等主流框架。
🧠 核心判断:记忆是Agent从"单次问答"进化为"长期协作"的关键瓶颈。四层蒸馏架构直击核心矛盾——如何在保持记忆精度的同时大幅压缩Token成本。
⚡ 行动点:对比TencentDB Agent Memory与你现有Agent框架的记忆方案,评估61%的Token节省对成本的实质影响
📎 来源:MarkTechPost[3]
04 · Howie Liu投入$1000万,扶持500家Agent-First创业公司
Airtable联合创始人Howie Liu通过Hyperagent推出"Founding 500"计划,向500家构建自主Agent产品的创业者提供每人$2万推理额度,总额$1000万。与传统的AI工具类创业不同,该计划要求产品必须实现"无需人工逐步引导即可完成端到端工作流"——这标志着投资方向从"AI辅助"正式转向"AI自主执行"。
🧠 核心判断:$1000万Agent专项基金的出现,验证了一个关键判断:Agent不再是技术Demo,而是可投资的独立产品品类。这比任何论文都更能说明Agent已进入产品化阶段。
⚡ 行动点:如果你的产品依赖Agent自主工作流,关注Hyperagent Founding 500申请条件和后续发布的入选项目特征
📎 来源:Startup Fortune[4]
🔥 GitHub 热门项目
本周GitHub Trending AI项目呈现清晰模式:语义搜索→代码库即上下文,多Agent系统→专业化分工,Agent框架→统一工具链。
01 · badlogic/pi-mono — Agent构建"万能"Monorepo
43.9k星,MIT协议。一个集LLM调用、UI渲染、运行时管理于一体的Agent工具包。不同于单一框架,pi-mono以Monorepo形式提供完整的Agent构建基础设施——统一的LLM API抽象层、生成式UI组件库、沙箱运行时环境。已在实际项目中被使用超过2个多月。
🧠 核心判断:Agent开发正在从"拼积木"走向"统一平台",pi-mono的Monorepo形态代表了Agent基础设施的下一阶段——减少集成摩擦、降低重复造轮子成本。
⚡ 行动点:对比pi-mono与LangChain/LlamaIndex在你技术栈中的集成成本
📎 仓库:github.com/badlogic/pi-mono[5]
02 · TauricResearch/TradingAgents — 用代码构建多Agent交易公司
62.6k星,Apache-2.0协议。模拟一个完整的量化交易公司架构:多个专业Agent(分析师、交易员、风控官)通过辩论机制协作决策。每个Agent扮演不同角色,持有不同分析框架,最终通过结构化辩论达成交易决策。配套学术论文发表于arXiv。
🧠 核心判断:多Agent辩论框架的价值远超金融交易——任何需要"多专家观点碰撞"的场景(医疗会诊、法务审查、战略决策)都可以复用这个架构范式。
⚡ 行动点:将TradingAgents的多角色辩论模式应用到你的领域(如内容审核、产品决策、风险评估)
📎 仓库:github.com/TauricResearch/TradingAgents[6]
03 · HKUDS/nanobot — 2月创建即达43k星,Agent自我进化引擎
43k星,MIT协议,2026年2月创建。一个支持
/goal长期目标锁定、多轮任务自动拆解的AI Agent引擎。5月发布v0.2.0——新增WebUI内嵌、5个新模型提供商+自动fallback、图像生成端到端、Agent循环重构。290位贡献者,16个Release,更新频率极高。
🧠 核心判断:3个月43k星的增长速度证明——开发者对"能自主设定长期目标并持续执行"的Agent需求极其强烈。/goal 命令的设计思路值得所有Agent产品参考。
⚡ 行动点:Star nanobot并关注其 /goal 长周期任务机制的技术实现细节
📎 仓库:github.com/HKUDS/nanobot[7]
🏛️ 政策与产业机会
政策正在从"鼓励研发"转向"加速落地":算力券+模型券+语料券组合拳在多个省市铺开,申报窗口正在打开。
01 · 国家发改委:谋划出台"人工智能+"配套文件,推动央国企开放场景
5月22日发改委发布会:正在谋划加快"人工智能+"落地的配套文件,进一步加大要素保障;将推动央国企开放高价值应用场景,打造人工智能标杆应用;同时开展AI立法研究,强化安全治理。此前已出台制造、医疗、能源等十余个行业"人工智能+"政策文件,布局一批国家AI应用中试基地。
🧠 核心判断:央国企开放场景意味着AI落地的"需求侧"正式由政策驱动——这不是补贴信号,而是市场规模信号。谁先对接央国企场景,谁拿下第一波B2G红利。
⚡ 行动点:梳理你所在行业已出台的"人工智能+"政策文件,定位央国企开放场景中的可切入环节
📎 来源:新浪财经[8]
02 · 上海"模塑申城"算力券/模型券/语料券申报:5月27日截止
上海市经信委2026年度补贴申报第1批次正在进行:①算力券——补贴租用智能算力做大模型/智能体研发;②模型券(Token券)——补贴调用第三方大模型API或私有化部署的Token费用;③语料券——补贴购买高质量语料。申报截止5月27日16:00。同步公示:上海2026年度国家AI算力服务补贴项目已进入公示阶段。
🧠 核心判断:算力券+模型券+语料券"三券齐发"是上海的标准动作,但本批次5月27日就截止——仅剩3天。后续批次每季度首月才有,错过这次要等3个月。
⚡ 行动点:立即登录zxzj.sheitc.sh.gov.cn提交申报,优先材料:算力/模型/语料服务合同 + 结算证明
📎 来源:上海市经信委[9]
📊 竞品监控动态
OpenAI与Anthropic在华尔街展开正面交锋,Google以Agent订阅制另辟蹊径,阿里用自主Agent打差异化——四大厂商的路线在加速分化。
01 · OpenAI/Anthropic 72小时内双双成立企业部署部门,争夺华尔街
过去72小时内,OpenAI和Anthropic几乎同时宣布成立企业部署部门,分别宣布重大金融服务合作,并发布针对华尔街关键工作流程的Agent工具。两家公司将AI Agent的竞争从模型能力延伸到"谁能真正嵌入金融操作系统"。
🧠 核心判断:华尔街成为Agent商业化的第一战场——这不是巧合。金融业的高价值、高复杂度、高容错要求,恰好是Agent能力的最佳验证场。谁的Agent先跑通真实交易场景,谁就在企业级市场建立护城河。
⚡ 行动点:如果你面向金融行业客户,立即研究OpenAI/Anthropic金融Agent的覆盖范围与你的产品重叠/互补
📎 来源:OpenTools.ai[10]
02 · GPT-5.5据传搭载Cerebras WSE-3芯片,推理速度飙至2000 tok/s
据36氪报道,GPT-5.5可能使用Cerebras WSE-3芯片——全球最大AI芯片,120B参数模型推理速度达2000 token/秒,远超Anthropic Opus。但SemiAnalysis同时指出Cerebras方案存在内存带宽和批处理局限性,不适合大规模并发推理。这一合作若属实,将打破NVIDIA在AI推理芯片的绝对主导地位。
🧠 核心判断:2000 tok/s的推理速度意味着实时Agent交互成为可能——从"等几秒"到"瞬间响应"。但Cerebras的局限也说明:推理芯片格局不会一夜之间改变,NVIDIA的CUDA生态护城河依然很深。
⚡ 行动点:关注Cerebras WSE-3的实际部署案例和客户反馈,不要仅看峰值速度数据做判断
📎 来源:36氪[11]
03 · Google Ultra降至$100/月:Agent订阅制商业模式浮出水面
配合Gemini Spark发布,Google将Ultra订阅价从$200降至$100/月,并将Spark首批开放给Ultra订阅者。这是首个主流AI厂商以"Agent订阅制"定价——不是按Token定价,而是按月订阅"一个24/7帮你干活的AI Agent"。
🧠 核心判断:$100/月的Agent订阅价锚定了B2C Agent的商业化基准线。如果Google跑通这个模式,将倒逼OpenAI、Anthropic跟进类似定价,终结当前的"按Token付费"时代。
⚡ 行动点:评估你的AI产品是否适合"Agent月费制"而非"Token计费制",测算单位用户成本拐点
📎 来源:Google Blog[2]
💬 用户需求洞察
用户的真实焦虑在浮出水面:AI能聊天但办不了事、速度快但不够聪明、企业内部部署要考虑安全——这些不是技术问题,是产品方向问题。
01 · 知乎热议:企业AI的"会聊天但办不了事"困境
知乎专栏讨论指出,多数企业AI尝试停留在"能聊天"阶段,缺乏调用企业业务系统(ERP、CRM、数据库)的能力。SkillsUI提出的解法是:通过API连接已有系统,让AI替人调度系统,激活旧系统投资。这与Google I/O中Gemini Spark连接Workspace的思路高度一致。
🧠 核心判断:"企业AI落地的最大障碍不是模型不够聪明,而是模型无法操作业务系统。" 这条洞察被Google I/O和知乎用户同时印证——Agent的MCP/API集成能力才是企业级落地的真正瓶颈。
⚡ 行动点:排查你的产品能连接多少个企业业务系统,列出缺失的关键API接口
📎 来源:知乎[12]
02 · 36氪评测:Gemini 3.5 Flash"速度快但不够聪明"引发争议
36氪评测指出Gemini 3.5 Flash在速度上表现出色,但在需要深度人文理解的复杂讨论中表现不足,且单位任务实际花费可能高于预期。评论区用户普遍认为"Benchmark分数不等于实际工作体验",对Agent产品的评判标准应该转向"完成率"而非"答题正确率"。
🧠 核心判断:用户对AI产品的评价标准正在从"答对多少题"转向"办成多少事"——这是一个根本性的需求升级。Agent产品的PMF应该用任务完成率衡量,不是Benchmark排名。
⚡ 行动点:在你的产品中引入"任务完成率"指标,替代或补充Benchmark得分作为质量判断标准
📎 来源:36氪[13]
03 · V2EX讨论:开源桌面Agent LeAgent适配DeepSeek,企业内部Agent的安全焦虑
V2EX上LeAgent项目引发讨论:该项目为企业行政人员设计本地运行Agent,实现文档编辑、数据分析、脚本生成。用户关注焦点不在功能,而在"数据不出企业内网"的安全保证。评论区高度关注DeepSeek本地部署方案,反映出企业对"云端Agent"的数据安全焦虑正在上升。
🧠 核心判断:Google推24/7云端Agent的同时,企业用户却在向"本地Agent"方向投票。这不是对立,而是分化——云端Agent适合个人消费者,本地Agent适合企业。两种路线将并行发展。
⚡ 行动点:如果你的产品面向企业场景,优先提供本地部署选项作为数据安全的"信任锚点"
📎 来源:V2EX[14]
💡 今日总结
🔝 立即关注
- 1. Gemini Spark 24/7 Agent — 全球首个主流厂商的"Agent订阅制"产品,$100/月定价将重塑AI商业化格局
- 2. Qwen3.7-Max 35小时自主优化 — 无人干预完成工程级任务,Agent从Demo走向生产的标志性事件
🎯 内容 / 产品选题建议
- • 《Agent订阅制来了:$100/月的AI能帮你做什么?》— 从Google Gemini Spark拆解Agent商业模式的5个维度
- • 《35小时无人干预:Qwen3.7-Max跑通的不仅是代码优化》— 技术深度分析:432次内核测试背后的自主纠错机制
- • 《企业AI落地死局:能聊天但办不了事》— 产品视角:如何让AI真正接入你的业务系统
📈 趋势判断
Agent的"自主执行能力"正在成为新的竞争维度——不是比谁答得好,而是比谁能独立完成任务。Google用24/7云端Agent、阿里用35小时芯片优化、腾讯用四层记忆系统,三条技术路线指向同一个方向:Agent必须能干完一整件事才算合格。接下来3个月,衡量AI产品优劣的标准将从Benchmark分数全面转向"任务完成率"。
⚠️ 风险提醒
Agent自主性提升的同时,企业对数据安全的焦虑正在加剧——V2EX用户对"本地Agent"的需求信号表明,云端Agent的隐私风险可能成为企业级推广的最大阻力。如果你的产品方案是纯云端Agent,需要提前准备本地部署或数据隔离方案。
✅ 今日行动清单
- • [ ] 登陆zxzj.sheitc.sh.gov.cn检查上海算力券/模型券申报资格,5月27日截止
- • [ ] 评测Qwen3.7-Max API在你Agent工作流中的实际表现
- • [ ] 将产品KPI从"模型准确率"切换到"任务完成率",建立新的质量基准
欢迎在评论区告诉我你最关注哪个方向,我们将优先追踪。
点赞、在看、转发,是对晨算最大的支持 🙏
阅读时长:约 8-10 分钟
关键词:自主Agent · Gemini Spark · Qwen3.7-Max · 算力券 · 企业部署
© 原创内容,版权归原作者所有
引用链接
[1] The Decoder: https://the-decoder.com/alibabas-latest-ai-model-ran-autonomously-for-35-hours-to-optimize-code-for-its-own-custom-chip/
[2] Google Blog: https://blog.google/innovation-and-ai/products/gemini-app/next-evolution-gemini-app/
[3] MarkTechPost: https://www.marktechpost.com/2026/05/23/tencent-open-sources-tencentdb-agent-memory-a-4-tier-local-memory-pipeline-for-ai-agents/
[4] Startup Fortune: https://startupfortune.com/howie-liu-is-backing-founders-building-ai-agent-companies/
[5] github.com/badlogic/pi-mono: https://github.com/badlogic/pi-mono
[6] github.com/TauricResearch/TradingAgents: https://github.com/TauricResearch/TradingAgents
[7] github.com/HKUDS/nanobot: https://github.com/HKUDS/nanobot
[8] 新浪财经: https://finance.sina.com.cn/jjxw/2026-05-22/doc-inhytusq8527317.shtml
[9] 上海市经信委: https://www.sheitc.sh.gov.cn/cyfz/20260507/cd1dcb1e5cb4449cbc36c69befafcc0a.html
[10] OpenTools.ai: https://opentools.ai/news/anthropic-openai-wall-street-ai-agents-race
[11] 36氪: https://36kr.com/p/3814659776896773
[12] 知乎: https://zhuanlan.zhihu.com/p/2041159744824553531
[13] 36氪: https://www.36kr.com/p/3817288277729541
[14] V2EX: https://www.v2ex.com/t/1214252
夜雨聆风