AI智能体早报 | 2026-05-24

导语　

谷歌I/O 2026发布Gemini Spark 24/7自主Agent，阿里Qwen3.7-Max在自研芯片上自主运行35小时实现10倍加速，腾讯开源四层Agent记忆系统——AI Agent正从"被动问答"跨越到"主动执行"。这三条主线同时出现，意味着什么？

本期聚焦：自主执行、企业部署、算力补贴。三件事搞清楚，明天比同行早一步。

🤖 AI 技术与工具前沿

本周Agent自主化能力密集突破：从芯片优化到记忆系统，从24/7后台运行到视频生成Agent，AI正从"能用"走向"能干活"。

01 · 阿里Qwen3.7-Max自主运行35小时，芯片代码优化10倍加速

阿里通义千问发布Qwen3.7-Max，专为自主Agent任务设计，仅通过API提供。在真实测试中，该模型在阿里自研T-Head-ZW-M890加速器上自主运行35小时，执行432次内核测试和1158次工具调用，实现平均10倍性能加速。对比竞品：GLM 5.1仅达7.3x、Kimi K2.6达5x、DeepSeek V4 Pro仅3.3x。该模型还被用作训练"看门狗"，自主检测训练过程中的作弊行为，编写13条新检测规则、标记1618个案例。

🧠 核心判断：自主Agent不再是Demo——35小时无人干预的工程级任务，标志着AI从辅助编程进入独立交付阶段。10x加速远超竞品，自研芯片+自研模型的垂直整合正在形成壁垒。

⚡ 行动点：评估Qwen3.7-Max API在你现有Agent工作流中的表现，关注Aliyun Model Studio的企业接口

📎 来源：The Decoder^[1]

02 · Google I/O发布Gemini Spark：24/7个人AI Agent，关电脑也不停

Google I/O 2026发布Gemini Spark——基于Gemini 3.5 Flash和Antigravity框架的云端Agent，即使关闭电脑/手机也能持续在后台执行任务。支持设置循环任务、教授新技能、创建工作流；深度集成Gmail/Docs/Slides等Workspace工具；即将通过MCP连接Canva、OpenTable、Instacart等第三方服务。Ultra订阅价从$200降至$100/月，测试版下周向美国Ultra用户开放。

🧠 核心判断：Google将Agent定义为"24/7云端数字助手"，与竞品桌面端Agent形成差异化。$100/月的定价锚定了"Agent订阅制"这一全新商业模式，将倒逼全行业跟进。

⚡ 行动点：如果你是Google Workspace重度用户，申请Gemini Spark测试资格；非Google生态用户关注同类竞品跟进节奏

📎 来源：Google Blog^[2]

03 · 腾讯开源TencentDB Agent Memory：四层记忆管道，Token用量降61%

腾讯开源了TencentDB Agent Memory，一个面向AI Agent的四层本地记忆系统。架构核心理念：将对话历史蒸馏为原子事实→场景→角色，形成金字塔式长期记忆。实测集成OpenClaw后，WideSearch通过率从33%提升至50%，Token使用量降低61.38%。支持Gateway适配器接入Hermes Agent等主流框架。

🧠 核心判断：记忆是Agent从"单次问答"进化为"长期协作"的关键瓶颈。四层蒸馏架构直击核心矛盾——如何在保持记忆精度的同时大幅压缩Token成本。

⚡ 行动点：对比TencentDB Agent Memory与你现有Agent框架的记忆方案，评估61%的Token节省对成本的实质影响

📎 来源：MarkTechPost^[3]

04 · Howie Liu投入$1000万，扶持500家Agent-First创业公司

Airtable联合创始人Howie Liu通过Hyperagent推出"Founding 500"计划，向500家构建自主Agent产品的创业者提供每人$2万推理额度，总额$1000万。与传统的AI工具类创业不同，该计划要求产品必须实现"无需人工逐步引导即可完成端到端工作流"——这标志着投资方向从"AI辅助"正式转向"AI自主执行"。

🧠 核心判断：$1000万Agent专项基金的出现，验证了一个关键判断：Agent不再是技术Demo，而是可投资的独立产品品类。这比任何论文都更能说明Agent已进入产品化阶段。

⚡ 行动点：如果你的产品依赖Agent自主工作流，关注Hyperagent Founding 500申请条件和后续发布的入选项目特征

📎 来源：Startup Fortune^[4]

🔥 GitHub 热门项目

本周GitHub Trending AI项目呈现清晰模式：语义搜索→代码库即上下文，多Agent系统→专业化分工，Agent框架→统一工具链。

01 · badlogic/pi-mono — Agent构建"万能"Monorepo

43.9k星，MIT协议。一个集LLM调用、UI渲染、运行时管理于一体的Agent工具包。不同于单一框架，pi-mono以Monorepo形式提供完整的Agent构建基础设施——统一的LLM API抽象层、生成式UI组件库、沙箱运行时环境。已在实际项目中被使用超过2个多月。

🧠 核心判断：Agent开发正在从"拼积木"走向"统一平台"，pi-mono的Monorepo形态代表了Agent基础设施的下一阶段——减少集成摩擦、降低重复造轮子成本。

⚡ 行动点：对比pi-mono与LangChain/LlamaIndex在你技术栈中的集成成本

📎 仓库：github.com/badlogic/pi-mono^[5]

02 · TauricResearch/TradingAgents — 用代码构建多Agent交易公司

62.6k星，Apache-2.0协议。模拟一个完整的量化交易公司架构：多个专业Agent（分析师、交易员、风控官）通过辩论机制协作决策。每个Agent扮演不同角色，持有不同分析框架，最终通过结构化辩论达成交易决策。配套学术论文发表于arXiv。

🧠 核心判断：多Agent辩论框架的价值远超金融交易——任何需要"多专家观点碰撞"的场景（医疗会诊、法务审查、战略决策）都可以复用这个架构范式。

⚡ 行动点：将TradingAgents的多角色辩论模式应用到你的领域（如内容审核、产品决策、风险评估）

📎 仓库：github.com/TauricResearch/TradingAgents^[6]

03 · HKUDS/nanobot — 2月创建即达43k星，Agent自我进化引擎

43k星，MIT协议，2026年2月创建。一个支持 /goal 长期目标锁定、多轮任务自动拆解的AI Agent引擎。5月发布v0.2.0——新增WebUI内嵌、5个新模型提供商+自动fallback、图像生成端到端、Agent循环重构。290位贡献者，16个Release，更新频率极高。

🧠 核心判断：3个月43k星的增长速度证明——开发者对"能自主设定长期目标并持续执行"的Agent需求极其强烈。/goal 命令的设计思路值得所有Agent产品参考。

⚡ 行动点：Star nanobot并关注其 /goal 长周期任务机制的技术实现细节

📎 仓库：github.com/HKUDS/nanobot^[7]

🏛️ 政策与产业机会

政策正在从"鼓励研发"转向"加速落地"：算力券+模型券+语料券组合拳在多个省市铺开，申报窗口正在打开。

01 · 国家发改委：谋划出台"人工智能+"配套文件，推动央国企开放场景

5月22日发改委发布会：正在谋划加快"人工智能+"落地的配套文件，进一步加大要素保障；将推动央国企开放高价值应用场景，打造人工智能标杆应用；同时开展AI立法研究，强化安全治理。此前已出台制造、医疗、能源等十余个行业"人工智能+"政策文件，布局一批国家AI应用中试基地。

🧠 核心判断：央国企开放场景意味着AI落地的"需求侧"正式由政策驱动——这不是补贴信号，而是市场规模信号。谁先对接央国企场景，谁拿下第一波B2G红利。

⚡ 行动点：梳理你所在行业已出台的"人工智能+"政策文件，定位央国企开放场景中的可切入环节

📎 来源：新浪财经^[8]

02 · 上海"模塑申城"算力券/模型券/语料券申报：5月27日截止

上海市经信委2026年度补贴申报第1批次正在进行：①算力券——补贴租用智能算力做大模型/智能体研发；②模型券（Token券）——补贴调用第三方大模型API或私有化部署的Token费用；③语料券——补贴购买高质量语料。申报截止5月27日16:00。同步公示：上海2026年度国家AI算力服务补贴项目已进入公示阶段。

🧠 核心判断：算力券+模型券+语料券"三券齐发"是上海的标准动作，但本批次5月27日就截止——仅剩3天。后续批次每季度首月才有，错过这次要等3个月。

⚡ 行动点：立即登录zxzj.sheitc.sh.gov.cn提交申报，优先材料：算力/模型/语料服务合同 + 结算证明

📎 来源：上海市经信委^[9]

📊 竞品监控动态

OpenAI与Anthropic在华尔街展开正面交锋，Google以Agent订阅制另辟蹊径，阿里用自主Agent打差异化——四大厂商的路线在加速分化。

01 · OpenAI/Anthropic 72小时内双双成立企业部署部门，争夺华尔街

过去72小时内，OpenAI和Anthropic几乎同时宣布成立企业部署部门，分别宣布重大金融服务合作，并发布针对华尔街关键工作流程的Agent工具。两家公司将AI Agent的竞争从模型能力延伸到"谁能真正嵌入金融操作系统"。

🧠 核心判断：华尔街成为Agent商业化的第一战场——这不是巧合。金融业的高价值、高复杂度、高容错要求，恰好是Agent能力的最佳验证场。谁的Agent先跑通真实交易场景，谁就在企业级市场建立护城河。

⚡ 行动点：如果你面向金融行业客户，立即研究OpenAI/Anthropic金融Agent的覆盖范围与你的产品重叠/互补

📎 来源：OpenTools.ai^[10]

02 · GPT-5.5据传搭载Cerebras WSE-3芯片，推理速度飙至2000 tok/s

据36氪报道，GPT-5.5可能使用Cerebras WSE-3芯片——全球最大AI芯片，120B参数模型推理速度达2000 token/秒，远超Anthropic Opus。但SemiAnalysis同时指出Cerebras方案存在内存带宽和批处理局限性，不适合大规模并发推理。这一合作若属实，将打破NVIDIA在AI推理芯片的绝对主导地位。

🧠 核心判断：2000 tok/s的推理速度意味着实时Agent交互成为可能——从"等几秒"到"瞬间响应"。但Cerebras的局限也说明：推理芯片格局不会一夜之间改变，NVIDIA的CUDA生态护城河依然很深。

⚡ 行动点：关注Cerebras WSE-3的实际部署案例和客户反馈，不要仅看峰值速度数据做判断

📎 来源：36氪^[11]

03 · Google Ultra降至$100/月：Agent订阅制商业模式浮出水面

配合Gemini Spark发布，Google将Ultra订阅价从$200降至$100/月，并将Spark首批开放给Ultra订阅者。这是首个主流AI厂商以"Agent订阅制"定价——不是按Token定价，而是按月订阅"一个24/7帮你干活的AI Agent"。

🧠 核心判断：$100/月的Agent订阅价锚定了B2C Agent的商业化基准线。如果Google跑通这个模式，将倒逼OpenAI、Anthropic跟进类似定价，终结当前的"按Token付费"时代。

⚡ 行动点：评估你的AI产品是否适合"Agent月费制"而非"Token计费制"，测算单位用户成本拐点

📎 来源：Google Blog^[2]

💬 用户需求洞察

用户的真实焦虑在浮出水面：AI能聊天但办不了事、速度快但不够聪明、企业内部部署要考虑安全——这些不是技术问题，是产品方向问题。

01 · 知乎热议：企业AI的"会聊天但办不了事"困境

知乎专栏讨论指出，多数企业AI尝试停留在"能聊天"阶段，缺乏调用企业业务系统（ERP、CRM、数据库）的能力。SkillsUI提出的解法是：通过API连接已有系统，让AI替人调度系统，激活旧系统投资。这与Google I/O中Gemini Spark连接Workspace的思路高度一致。

🧠 核心判断："企业AI落地的最大障碍不是模型不够聪明，而是模型无法操作业务系统。" 这条洞察被Google I/O和知乎用户同时印证——Agent的MCP/API集成能力才是企业级落地的真正瓶颈。

⚡ 行动点：排查你的产品能连接多少个企业业务系统，列出缺失的关键API接口

📎 来源：知乎^[12]

02 · 36氪评测：Gemini 3.5 Flash"速度快但不够聪明"引发争议

36氪评测指出Gemini 3.5 Flash在速度上表现出色，但在需要深度人文理解的复杂讨论中表现不足，且单位任务实际花费可能高于预期。评论区用户普遍认为"Benchmark分数不等于实际工作体验"，对Agent产品的评判标准应该转向"完成率"而非"答题正确率"。

🧠 核心判断：用户对AI产品的评价标准正在从"答对多少题"转向"办成多少事"——这是一个根本性的需求升级。Agent产品的PMF应该用任务完成率衡量，不是Benchmark排名。

⚡ 行动点：在你的产品中引入"任务完成率"指标，替代或补充Benchmark得分作为质量判断标准

📎 来源：36氪^[13]

03 · V2EX讨论：开源桌面Agent LeAgent适配DeepSeek，企业内部Agent的安全焦虑

V2EX上LeAgent项目引发讨论：该项目为企业行政人员设计本地运行Agent，实现文档编辑、数据分析、脚本生成。用户关注焦点不在功能，而在"数据不出企业内网"的安全保证。评论区高度关注DeepSeek本地部署方案，反映出企业对"云端Agent"的数据安全焦虑正在上升。

🧠 核心判断：Google推24/7云端Agent的同时，企业用户却在向"本地Agent"方向投票。这不是对立，而是分化——云端Agent适合个人消费者，本地Agent适合企业。两种路线将并行发展。

⚡ 行动点：如果你的产品面向企业场景，优先提供本地部署选项作为数据安全的"信任锚点"

📎 来源：V2EX^[14]

💡 今日总结

🔝 立即关注

1. Gemini Spark 24/7 Agent — 全球首个主流厂商的"Agent订阅制"产品，$100/月定价将重塑AI商业化格局
2. Qwen3.7-Max 35小时自主优化 — 无人干预完成工程级任务，Agent从Demo走向生产的标志性事件

🎯 内容 / 产品选题建议

• 《Agent订阅制来了：$100/月的AI能帮你做什么？》— 从Google Gemini Spark拆解Agent商业模式的5个维度
• 《35小时无人干预：Qwen3.7-Max跑通的不仅是代码优化》— 技术深度分析：432次内核测试背后的自主纠错机制
• 《企业AI落地死局：能聊天但办不了事》— 产品视角：如何让AI真正接入你的业务系统

📈 趋势判断

Agent的"自主执行能力"正在成为新的竞争维度——不是比谁答得好，而是比谁能独立完成任务。Google用24/7云端Agent、阿里用35小时芯片优化、腾讯用四层记忆系统，三条技术路线指向同一个方向：Agent必须能干完一整件事才算合格。接下来3个月，衡量AI产品优劣的标准将从Benchmark分数全面转向"任务完成率"。

⚠️ 风险提醒

Agent自主性提升的同时，企业对数据安全的焦虑正在加剧——V2EX用户对"本地Agent"的需求信号表明，云端Agent的隐私风险可能成为企业级推广的最大阻力。如果你的产品方案是纯云端Agent，需要提前准备本地部署或数据隔离方案。

✅ 今日行动清单

• [ ] 登陆zxzj.sheitc.sh.gov.cn检查上海算力券/模型券申报资格，5月27日截止
• [ ] 评测Qwen3.7-Max API在你Agent工作流中的实际表现
• [ ] 将产品KPI从"模型准确率"切换到"任务完成率"，建立新的质量基准

欢迎在评论区告诉我你最关注哪个方向，我们将优先追踪。

点赞、在看、转发，是对晨算最大的支持 🙏

阅读时长：约 8-10 分钟

关键词：自主Agent · Gemini Spark · Qwen3.7-Max · 算力券 · 企业部署

引用链接

[1] The Decoder: https://the-decoder.com/alibabas-latest-ai-model-ran-autonomously-for-35-hours-to-optimize-code-for-its-own-custom-chip/
[2] Google Blog: https://blog.google/innovation-and-ai/products/gemini-app/next-evolution-gemini-app/
[3] MarkTechPost: https://www.marktechpost.com/2026/05/23/tencent-open-sources-tencentdb-agent-memory-a-4-tier-local-memory-pipeline-for-ai-agents/
[4] Startup Fortune: https://startupfortune.com/howie-liu-is-backing-founders-building-ai-agent-companies/
[5] github.com/badlogic/pi-mono: https://github.com/badlogic/pi-mono
[6] github.com/TauricResearch/TradingAgents: https://github.com/TauricResearch/TradingAgents
[7] github.com/HKUDS/nanobot: https://github.com/HKUDS/nanobot
[8] 新浪财经: https://finance.sina.com.cn/jjxw/2026-05-22/doc-inhytusq8527317.shtml
[9] 上海市经信委: https://www.sheitc.sh.gov.cn/cyfz/20260507/cd1dcb1e5cb4449cbc36c69befafcc0a.html
[10] OpenTools.ai: https://opentools.ai/news/anthropic-openai-wall-street-ai-agents-race
[11] 36氪: https://36kr.com/p/3814659776896773
[12] 知乎: https://zhuanlan.zhihu.com/p/2041159744824553531
[13] 36氪: https://www.36kr.com/p/3817288277729541
[14] V2EX: https://www.v2ex.com/t/1214252