AI前沿速递·5月20日|Gemini 3.5 Flash默认·Spark助手·通义重磅发布
Gemini 3.5 Flash·Spark 24/7助手·通义Qwen3.7发布·Meta裁员落地·TPU 8发布
Google I/O 2026重磅发布:Gemini 3.5 Flash成为新默认模型,速度提升4倍反超Pro;Spark全天候AI助手下周上线,关闭电脑也能持续工作;Antigravity 2.0对标Claude Code和Codex;Gemini Omni视频生成世界模型今夏登场;TPU 8发布,分为训练和推理两大版本;AI Ultra订阅降价至$100/月;阿里云峰会正式发布Qwen3.7-Max旗舰模型,Arena全球盲测国产第一;Meta 8000人裁员今日正式落地,7000人转岗AI部门。
Gemini 3.5 Flash成为新默认模型,编码和Agent基准反超Gemini 3.1 Pro
Google I/O 2026发布Gemini 3.5 Flash并立即设为Gemini应用和AI Mode搜索的默认模型。该模型在Terminal-Bench 2.1编码测试中得分76.2%超越Pro的70.3%,MCP Atlas智能体基准领跑全场,Finance Agent v2领先14.9分。推理速度约为此前沿模型的4倍,在Antigravity 2.0环境中更可达12倍。API定价$1.50/百万输入Token,较Pro便宜40%,但比旧版Flash预览贵3倍。
▸ 层级反转:Flash模型首次在编码和智能体基准上超越Pro,标志小模型也能打大仗
▸ API定价:输入$1.50/M输出$9.00/M,缓存$0.15/M,比Pro便宜40%但比旧Flash贵3倍
▸ thinking_level:旧thinking_budget参数替换为字符串枚举,默认medium(预览版为high),迁移需注意
▸ Pro后续:Gemini 3.5 Pro预计6月发布,面向深度知识和长上下文推理场景
来源:buildfastwithai.com / 每经 / 新浪财经 2026-05-20
Spark全天候AI助手:关闭电脑也能工作,下周美国Ultra用户抢先体验
Google发布Gemini Spark全天候个人AI助手,运行在Google Cloud虚拟机上,即便关闭电脑也能持续执行任务。Spark可拉取Gmail、Docs、Sheets、Slides数据,拥有专用邮箱地址,通过Chrome浏览器浏览网页。现场演示了策划派对全流程:汇总回复、追踪物品、发邮件、创建表格和PPT。下周向美国AI Ultra订阅用户开放测试,夏天将在Chrome浏览器中运行。Android Halo提供手机端可视化入口。
▸ 核心架构:运行在Google Cloud专用VM上,关闭设备后仍持续工作,真正实现'离线代理'
▸ 数据打通:无缝接入Gmail、Docs、Sheets、Slides,专用邮箱可直接接收任务指令
▸ Android Halo:手机端可视化入口,实时显示Agent运行状态和任务进展
▸ 定价策略:AI Ultra从$250/月降至$100/月,配5倍用量上限和20TB云存储,大幅降低门槛
来源:TomsGuide / 新浪财经 / 搜狐 2026-05-20
Antigravity 2.0发布对标Claude Code:Agent原生编程平台,支持并行子Agent
Google推出Antigravity 2.0智能体编程平台,直接对标Claude Code和OpenAI Codex。该平台'毫不掩饰地以智能体为先',曾用于从零构建操作系统。核心能力包括并行子Agent执行、定时任务调度、Managed Agents API(单次调用创建持久化Agent)、Interactions API(服务端历史管理,对标OpenAI Responses API)。在Antigravity 2.0内部,Gemini 3.5 Flash速度可达标准前沿模型的12倍。
▸ 定位清晰:明确对标Claude Code和Codex,Agent-first架构专为自主编程设计
▸ 并行子Agent:支持多Agent并行执行复杂任务,突破单Agent能力上限
▸ Managed Agents API:单次API调用创建带持久化状态的Agent,跨调用保持上下文
▸ 生态整合:与Google Cloud、Firebase深度集成,为开发者提供端到端Agent开发体验
来源:buildfastwithai.com / 虎嗅 / CSDN 2026-05-20
通义千问Qwen3.7-Max正式发布:Arena全球盲测国产第一,支持35小时智能体自主进化
阿里云峰会上正式发布千问旗舰模型Qwen3.7-Max,在第三方机构Arena全球大模型盲测总榜中位列国产第一。Qwen3.7-Max在知识掌握、逻辑推理、工具调用和编程能力等关键维度均显著提升,全自主训练不依赖任何外部模型输出。特别亮点是支持35小时智能体自主进化能力,可实现长时间自主任务执行。同期发布Qwen3.7-Plus-Preview,面向开发者预览测试。
▸ Arena排名:在Arena全球大模型盲测总榜中位列国产第一,与GPT-4o和Claude等国际模型同台竞技
▸ 全自主训练:完全自主训练流程,不依赖任何外部模型输出,确保数据安全和可控性
▸ 35小时进化:支持长达35小时的智能体自主进化,可在长时间运行中持续优化自身策略
▸ 企业落地:阿里云AI相关产品季度收入89.71亿元,ARR突破358亿元,百炼平台客户数同比增8倍
来源:快科技 / 上证报 / ZOL 2026-05-20
Meta 8000人裁员今日正式落地,员工连夜搜刮零食,新加坡员工首当其冲
Meta 8000人裁员计划于5月20日正式执行,占全球员工约10%。据纽约时报报道,受影响员工连夜搜刮办公室零食和充电器。新加坡员工首当其冲被通知裁员。约7000人被重新分配至应用AI工程(AAI)和智能体转型加速器等新团队。Meta同时冻结6000个空缺岗位,2026年AI资本支出预期达$1150-1350亿,从社交媒体公司快速转型为'AI优先'企业。
▸ 裁员规模:8000人直接裁减+6000岗位冻结+7000人AI转岗,总计影响约20%劳动力
▸ 执行现场:新加坡员工首当其冲,多地员工连夜收拾办公物品,社交媒体流传'搜刮零食'画面
▸ 资金转移:人力成本削减释放资金全力投入GPU集群,2026年AI资本支出$1150-1350亿
▸ 战略转型:从社交媒体公司转型AI优先企业,CEO Zuckerberg称'效率之年'进入深水区
来源:智东西 / 纽约时报 / TechRepublic 2026-05-20
Gemini Omni世界模型发布:对话式视频生成,今夏Flash版登场
Google发布全新视频生成世界模型Gemini Omni,能根据任何输入(文字、图片、视频)生成视频。核心亮点是对话式编辑能力——可随时修改视频中的角色、背景、风格等元素,支持自拍转换为其他风格。首款模型Gemini Omni Flash将于今年夏季推出。Gemini应用同步接入Omni视频编辑能力,新增交互式图像反馈、视频时间线功能和'每日简报'智能体。
▸ 世界模型定位:不只是视频生成工具,而是理解物理世界规律的世界模拟器
▸ 对话式编辑:突破传统视频编辑的时间线模式,用自然语言直接修改视频中的任何元素
▸ 多模态输入:文字、图片、视频均可作为输入,支持跨模态创意组合
▸ 生态整合:Gemini应用集成Omni能力,YouTube接入Ask YouTube对话式搜索
来源:新浪财经 / 凤凰科技 / The Keyword 2026-05-20
Google发布TPU 8:训练和推理双版本,支撑3.2千万亿Token月处理量
Google在I/O大会发布第八代张量处理单元TPU 8,分为训练专用版TPU 8t和推理优化版两大版本。CEO Sundar Pichai披露,Google每月处理Token数量已达3.2千万亿个,同比增长7倍。Gemini应用月活跃用户达9亿。AI基础设施预计支出$1800-1900亿,TPU 8将支撑Spark VM、Antigravity加速等海量计算需求。Google搜索同日庆祝25周年。
▸ 双版本架构:TPU 8t训练专用+推理优化版,针对不同工作负载分别优化,提升整体效率
▸ Token暴涨:月处理量3.2千万亿个,同比增7倍,反映AI应用需求爆发式增长
▸ 基础设施投入:2026年AI基础设施支出预计$1800-1900亿,与微软、Meta等巨头竞赛
▸ 搜索25周年:Google搜索迎来25周年,从PageRank到AI Mode,标志搜索引擎的范式革命
来源:每经 / Google Official Blog 2026-05-20
Google发布Universal Cart:跨搜索/YouTube/Gmail通用购物车,AI可直接下单
Google推出Universal Cart通用购物车和Universal Commerce Protocol(UCP),实现跨Google搜索、Gemini、YouTube、Gmail的统一购物体验。AI Agent可通过UCP直接在Amazon、Walmart、Shopify、Meta等合作伙伴平台完成购买。Google的收入模式从搜索广告点击转向交易抽成(GMV)。AI Mode搜索同步接入编程能力,可生成交互式画面和'迷你应用'。
▸ 跨平台整合:搜索、Gemini、YouTube、Gmail商品一键汇集到通用购物车,打破平台壁垒
▸ Agent下单:AI Agent可直接通过UCP在合作电商平台完成购买,无需人工跳转
▸ 收入变革:从搜索广告CPC模式转向交易抽成GMV模式,Google电商野心显露
▸ AI购物功能:追踪优惠、价格监控、历史价格展示、库存提醒、硬件兼容性识别
来源:TechCrunch / Search Engine Journal / Mashable 2026-05-20
Android XR眼镜正式发布:语音版秋季上市,显示版信息投射视野
Google发布Android XR智能眼镜,与Gentle Monster、Warby Parker、三星联合打造。分为两类:语音眼镜(Gentle Monster/Warby Parker款)支持自然语言对话,秋季上市,兼容iOS和Android;显示眼镜可将信息投射到用户视野中。现场演示用户通过眼镜让Gemini导航至咖啡馆、打开外卖App并准备好常点订单——手机全程在口袋中。Samsung代号为'Jinju'的轻量版约50g。
▸ 双产品线:语音眼镜主打对话交互,显示眼镜主打信息增强,覆盖不同使用场景
▸ Pocket-first体验:演示中手机全程放口袋,眼镜成为主要交互界面,标志移动交互范式转移
▸ 合作伙伴:Gentle Monster时尚设计、Warby Parker渠道优势、三星硬件制造能力三强联合
▸ AI驱动:Gemini深度集成眼镜,支持导航、点餐、翻译等日常场景的端到端AI体验
来源:新浪财经 / 凤凰科技 / 搜狐 2026-05-20
腾讯Ardot设计智能体公测:一句话生成UI设计稿并一键转代码
腾讯自研AI设计智能体平台Ardot正式公测,定位AI驱动的产设研协作平台。核心能力:一句话生成团队可编辑的UI/UX设计稿,并可直接转换为可运行的代码。支持W3C标准的斜切、3D旋转等高级设计元素,提供macOS客户端和网页端。公测期间注册即享1000 Credits免费额度。同期阿里上线QoderWork AI Native设计工作台,AI原生设计工具赛道竞争白热化。
▸ 核心差异化:不只是画图工具,而是从设计到代码的端到端协作平台,打通产设研全流程
▸ 技术能力:支持W3C标准高级设计元素(斜切、3D旋转等),生成的设计稿团队可协作编辑
▸ 免费策略:公测1000 Credits免费,降低企业试错成本,加速AI设计工具普及
▸ 行业趋势:AI原生设计工具密集发布,传统设计软件面临被AI重新定义的挑战
来源:腾讯新闻 / Chinaz / 新浪科技 2026-05-18/20
Google的Agent全域战略:从搜索到购物的闭环
Google I/O 2026最深层的信息不是某个模型或产品,而是Google正在构建一个完整的Agent生态系统。Spark负责24/7个人助理,Antigravity负责开发者Agent构建,Information Agent负责搜索领域的持续监控,UCP负责Agent驱动的电商交易。当AI可以自主搜索、比价、下单并完成支付,Google将从'信息中介'进化为'行动中介',这将从根本上改变其商业模式。
同一天内,Google发布Agent原生开发平台Antigravity 2.0和全天候助手Spark,阿里发布支持35小时自主进化的Qwen3.7-Max。两国AI巨头不再比拼单一的模型参数或benchmark分数,而是争相定义AI Agent的操作系统级基础设施。谁能率先建立最完善的Agent生态,谁就掌握下一个十年的计算平台话语权。
Gemini 3.5 Flash的API定价策略($1.50/M输入,比Pro便宜40%但比旧Flash贵3倍)揭示了行业新趋势:大模型API不再是简单的'越大越贵',而是根据推理深度、缓存策略、运行环境进行精细化分层。thinking_level参数的出现更意味着推理能力本身成为可调节的商品。开发者需要从'选模型'转向'调参数'的精细化运营。
Meta今日裁掉8000人同时转岗7000人至AI部门,这不仅是单一公司的重组,更是一面行业镜子。当AI资本支出攀升至$1350亿而人力成本被削减,当Agent可以自主执行越来越多原本需要人工的任务,'用算力换人力'正在从理论变为现实。对从业者而言,比担心AI替代自己更紧迫的问题是:你是在被替代的一侧,还是在操控AI的一侧?
© 2026 Frontier Signal · 保留所有权利