今天 AI 圈值得知道的 6 件事。
01|Andrej Karpathy 入职 Anthropic

Karpathy 在 2026-05-19 公开消息:「I've joined Anthropic」,加入 Anthropic 的预训练团队,团队负责人是 Nick Joseph。这条短短的英文公告几小时内拿到 13.4 万个赞,是当天 AI 圈互动量最高的内容。
他的轨迹很长:2017 年从 OpenAI 离开去 Tesla 主管 Autopilot 与 Full Self-Driving,2022 年回到 OpenAI,2024 年又独立创办教育向初创 Eureka Labs。Anthropic 这边说,他会带一支小队,研究用 Claude 加速预训练本身。他自己也补了一句:教育的事还会继续,时间到了再恢复。
预训练这几年被很多人说成「曲线接近顶」,Karpathy 用脚投票选择回到这条主线,对外释放的信号是:他认为前沿模型未来三五年还会有大动作,不是一个吃光的赛道。
02|Google 发布 Gemini 3.5 Flash:编码超 3.1 Pro、价格涨 3 倍

Google 在 I/O 2026 第二天上线 Gemini 3.5 Flash,定位是「便宜、快、给 Agent 跑的」那一档。官方给的数字:编码与 Agent 任务超过上一代 Gemini 3.1 Pro,平均比同档前沿模型快 4 倍,在自家 Antigravity 环境里能跑到约 800 tok/s、相当于 12 倍加速。上下文窗口 100 万 token。
价格争议比性能大。新版定价是输入 1.5 美元、输出 9 美元(每百万 token),比上一代 Gemini 3 Flash 的 0.5 / 3 直接翻三倍。缓存输入 0.15 美元。第三方独立测试者把这条数据放在显眼位置反复提醒:涨价 3 倍,但 Google 自家所有产品线都打算切到它上面跑。
这是一次同时把价格和能力都往上抬的发布。低价 Flash 那条线消失了,Flash 现在更像「轻量 Pro」。对小厂来说,便宜的 Gemini 入门档不在了。
03|Google 推出 Gemini Omni:多模态编辑跨向世界模型

Gemini Omni 是 Google 这次 I/O 上调子拔得最高的一个产品,官方原话是「multimodal editing 的 major leap」。它把文字、图片、视频、音频四种输入混在一起,输出一段最长 10 秒的视频,画面里的物体运动、镜头切换、物理感都比之前更像真的。
底层是几条 DeepMind 旧产线拼起来的:Nano Banana 管图像生成、Veo 管视频、Genie 管可交互世界。Demis Hassabis 把它定位成「世界模型」方向上的一步——不只是生成像素,而是能预测「下一秒物理上会发生什么」。Gemini Omni Flash 当天上线 Gemini App 和 FlowByGoogle,AI Plus 订阅用户先用。
10 秒上限是产品决定,不是技术做不到。Google 自己说,「大多数人现在只想做短视频发社交平台」。世界模型这个词以前是 DeepMind 老板每年念叨的概念,今天第一次以产品形态推到普通用户面前。
04|OpenAI 给企业客户 1-3 年算力承诺,YC 每家投 $2M token

Sam Altman 当天发了两条公告。一条对企业客户:愿意签 1-3 年的长期算力合约,签的客户可以锁定 token 价格、享受折扣,OpenAI 也能据此提前规划机房。后面他自己补充:这一波只到当前配额卖完为止,ChatGPT 与 Codex 的容量留够;下次再开放。
另一条对创业者:OpenAI 给现在这一批 YC 学员,每家送 200 万美元的 token 额度,不是现金,是 OpenAI 自家 token 信用。他用了一个新词「tokenmaxxing」——把模型用量当成产品的核心增长指标,能用多少就用多少,越用越值钱。
两条放在一起读:一条锁住大客户的长期消耗,一条把下一批可能跑起来的小公司直接绑到 OpenAI 的 token 上。算力供给紧的时候,长期合约和补贴入口比模型本身更影响竞争格局。
05|Antigravity 2.0 改版 UI 像 Codex——AI 编程 IDE 收敛同形

Google 在 I/O 上把 Antigravity 升到 2.0,桌面端是基于 VS Code 重写的分叉版本,多加了「Mission Control」面板用来同时管多个 Agent 并行任务,还内嵌了 Chromium 浏览器——Agent 可以自己打开网页、点按钮、切到移动端视口确认 UI 改完是不是对的。Google 同时上线了 CLI 工具和自定义工作流 SDK。
业内开发者发现:改完版的整体交互长得很像 OpenAI 的 Codex。再加上 Cursor、Claude Code、Codex、Antigravity 这一圈 AI 编程工具,主面板布局、Agent 任务流、代码评审环节都在朝同一种形态收敛。
收敛是好事还是坏事各有看法,但本质是:业内已经达成共识,AI 写代码的人机交互该长成什么样了。剩下比的是模型、是工具调用速度、是后面那条算力链——而不是「谁的界面更新颖」。
06|Google 推 Agent 电商三件套:UCP + AP2 + Universal Cart

I/O 2026 上 Google 公布了一套 Agent 电商基建:UCP 是 Universal Commerce Protocol(通用商业协议),AP2 是 Agent Payments Protocol(Agent 支付协议),上层产品叫 Universal Cart(统一购物车)——能在 Google Search、Gemini App、YouTube、Gmail 里跨场景加购,最后用 Google Pay 几步结账。
AP2 的设计点在边界:用户提前告诉 Agent 自己想买什么品牌、什么型号、最高出多少钱,Agent 满足全部条件才会下单;交易留下加密的「数字授权书」,用户、商家、支付机构三方都能验证 Agent 是不是真在按用户意愿做事。首批接入的有 Nike、Sephora、Target、Ulta、Walmart、Wayfair 和 Shopify 上的部分品牌。
这一套铺出去,Google 想做的不是某个 Agent 应用,是 Agent 时代电商交易的底层规则——从「谁有资格代用户付钱」开始定义。规则定下来,跑在上面的所有 Agent 都得按它的方式拿用户的钱包。
骑龙 · 2026-05-20
夜雨聆风