用今天的 AI 新工具偷懒 1 小时,主管还夸我

AI 工具自由之路|DAILY · ISSUE NO.140

2026年05月20日今日 AI 速览

AI 圈全景周三 · 共 34 条精选 · 编辑整理与点评

✍️ 编辑观察

2026年05月20日 AI 圈一共给我们送来 34 条值得一看的消息。其中「模型发布/更新」是今天的绝对主角，一口气贡献了 8 条，信号很明显。紧随其后的「产品发布/更新」也有 8 条，值得顺手扫一眼。信息密度上来了，节奏别乱。先扫版块标题，命中再读正文，三分钟搞定今日 AI。

🧠 模型发布/更新 · 共 8 条

1. I/O 2026: 欢迎来到自主的 Gemini 时代

Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代，新功能使其能够自动执行复杂任务，显著提升用户工作效率。

来源：Google Blog：AI（RSS）

2. 谷歌发布Gemini Omni多模态生成模型

介绍Gemini Omni，我们的新模型，可以从任何输入创建任何内容，首先从视频开始。

来源：X：Gemini (@GeminiApp)

3. Gemini Omni：迈向AGI的世界模型

真正的“哇”时刻是 Gemini Omni。

来源：X：Kim (@kimmonismus)

4. Gemini Omni发布：物理推理与多模态生成新突破

Gemini Omni不仅能构建逼真的场景，还能推理接下来应该发生什么。

来源：X：Sundar Pichai (@sundarpichai)

5. Gemini Omni发布：多模态生成新突破

我们推出Gemini Omni：这是迈向一个能从任何内容生成任何内容的模型的第一步——从视频开始。

来源：X：Google DeepMind (@GoogleDeepMind)

6. 谷歌 Gemini Omni 全能模型发布：可从任意输入生成任意输出，一句话让 …

在2026年谷歌I/O开发者大会上，谷歌正式推出Gemini Omni模型。

来源：IT之家（RSS）

7. Gemini Omni发布，迈向AGI新进展

„迈向AGI的进展“：Gemini Omni - 世界模型 -Gemini Omni官方发布！

来源：X：Kim (@kimmonismus)

8. 首个实时多agent世界模型发布，人类可与AI同屏互动

奥德赛实验室推出Agora-1，这是全球首个实时多agent世界模型，允许多人与AI同时在同一个模拟世界中实时互动并相互影响。

来源：X：Berry Xia (@berryxia)

小编说：新模型很多，但值得上手的永远是少数几个，挑着试。

📱 产品发布/更新 · 共 8 条

9. 谷歌推出全新AI智能搜索框，支持多模态交互

谷歌宣布推出基于Gemini 3.5模型的全新智能搜索框。

来源：X：Google AI (@GoogleAI)

10. Claude智能体托管平台新增自托管沙箱与MCP隧道功能

Anthropic为其Claude智能体托管平台推出两项更新：自托管沙箱允许用户在自有基础设施或合作云平台上运行工具，确保敏感数据与服务保留在用户控制范围内；MCP隧道则通过轻量网关，使智能体能安…

来源：Claude：Blog（网页）

11. Gemini Spark：全天候个人AI代理

Gemini Spark 是您的全天候个人AI代理，帮助您驾驭数字生活。

来源：X：Gemini (@GeminiApp)

12. Google Workspace 推出全新创建方式与高效工作功能

Google 在最新更新中为 Gmail、Docs 和 Keep 增添了新的语音功能，并推出了一款名为 Google Pics 的全新设计工具。

来源：Google Blog：AI（RSS）

13. Ramp利用Gemini API构建高级财务代理

通过使用Gemini API中的新托管代理功能，@Ramp在无需接触后端基础设施的情况下构建了其高级财务代理。

来源：X：Google AI for Developers (@googleaidevs)

14. Gemini Omni助力Google Flow创作电影级故事

Google Flow 🤝 Gemini Omni 使用我们的最新模型创作更具电影感的故事，它带来了批量编辑、改进的角色一致性等功能。

来源：X：Google DeepMind (@GoogleDeepMind)

15. 宣布Claude Managed Agents登陆Cloudflare

Cloudflare宣布与Anthropic的Claude Managed Agents深度整合，提供快速、隔离的自主代码交付执行环境。

来源：Cloudflare Blog

16. Claude推出自托管沙箱与MCP隧道功能

来自Code with Claude伦敦现场：我们正在Claude Managed Agents中推出自托管沙箱（公测版）和MCP隧道（研究预览版）。

来源：X：Claude (@claudeai)

小编说：别被发布会带节奏，回到自己场景里问一句"我会天天用它吗"。

📰 行业动态 · 共 8 条

17. Karpathy加入Anthropic团队

欢迎加入团队，Andrej！

来源：X：Claude Devs (@ClaudeDevs)

18. 安德烈·卡帕西加入Anthropic

AI领域知名专家安德烈·卡帕西于2026年5月19日宣布加入人工智能安全公司Anthropic。

来源：Hacker News 热门（buzzing.cc 中文翻译）

19. 前OpenAI核心成员Andrej Karpathy选择Anthropic重返前…

著名AI研究人员Andrej Karpathy已加入Anthropic。

来源：The Decoder：AI News（RSS）

20. Google I/O 2026

在Google I/O 2026大会上，Google宣布了多项旨在让AI更普惠、更实用的更新。

来源：Google Blog：AI（RSS）

21. Andrej加入Anthropic，马斯克也点赞

Andrej加入了Anthropic。连Elon都忍不住称赞Anthropic。 Anthropic今天在Google I/O上真是气场全开。

来源：X：Yuchen Jin (@Yuchenj_UW)

22. 谷歌每月处理超 3200 万亿 Token，同比增长 7 倍

在2026年谷歌I/O开发者大会上，谷歌宣布其AI业务关键指标大幅增长。

来源：IT之家（RSS）

23. Anthropic联合创始人将与教皇利奥十四世共同发布人工智能通谕

Anthropic联合创始人将于2026年5月与教皇利奥十四世共同发布首个人工智能通谕“magnifica humanitas”。

来源：Hacker News 热门（buzzing.cc 中文翻译）

24. Gemini月活用户超9亿，回顾年度重大功能发布

每月有超过9亿用户使用Gemini应用。这一增长的重要部分源于我们快速的发布节奏。以下是过去一年我们推出的一些最重要功能的回顾。🧵 #GoogleIO

来源：X：Gemini (@GeminiApp)

小编说：别只看谁融了多少钱，看他要用这笔钱抢谁的生意。

📄 论文研究 · 共 2 条

25. 研究发现人类说服技巧对AI同样有效

🚨我们的论文已在PNAS发表：我们发现经典的人类说服技巧以一种“类人”的方式对AI有效，使其同意不当请求（将顺从率从35%提高到51%）该技巧对一系列主流大语言模型有效，尽管较新的模型抵抗力更强…

来源：X：Ethan Mollick (@emollick)

26. 开源古代汉字视觉感知评估基准Chronicles-OCR

开源了评估视觉大语言模型（VLLM）对古代汉字视觉感知能力的基准测试Chronicles-OCR。

来源：X：腾讯混元 (@TencentHunyuan)

小编说：顶会风向就是下一季产品功能的剧透片。

💡 技巧与观点 · 共 8 条

27. Forge：通过防护机制大幅提升8B模型性能的可靠性层

Forge 是一个为自托管大语言模型设计的可靠性层，专注于提升工具调用能力。

来源：Hacker News：AI 热帖

28. NVIDIA开源首个4-bit超长视频生成基础设施

NVIDIA研究员开源LongLive 2.0，这是首个支持4-bit量化、覆盖训练与推理全流程的端到端长视频生成基础设施。

来源：X：Berry Xia (@berryxia)

29. AI代理集成新方案：Membrane推出单一技能连接万种API

AI代理在实际应用中需为每个外部服务重复构建集成逻辑，成为其发展的主要瓶颈。

来源：X：Rohan Paul (@rohanpaul_ai)

30. Claude Code的HTML输出：非凡的有效性

Claude Code团队正从Markdown转向HTML作为主要输出格式。

来源：Claude：Blog（网页）

31. Claude实现真实界面操作的生产实践指南

计算机使用功能使Claude成为能够操作真实用户界面的智能体。

来源：X：Claude Devs (@ClaudeDevs)

32. ChatGPT图像生成周使用量突破15亿次

人们每周在ChatGPT中生成超过15亿张图像。

来源：X：OpenAI (@OpenAI)

33. DAA：智能体时代的核心指标

这里快速补充一个指标新词：DAA。全称 Daily Active Agents（每日活跃智能体），相当于智能体时代的 DAU。如果说代币经济学追踪成本，那么 DAA 追踪产出——智能体实际完成…

来源：X：百度 Baidu (@Baidu_Inc)

34. 拓宽关于前沿AI的对话

Anthropic为构建负责任的先进AI，正与全球多元群体展开对话。

来源：Anthropic：Newsroom（网页）

小编说：AI 用得好不好，差距在"愿不愿意动手试"这一步。

🔥 全网 AI 热议 · 共 10 条

本版块来自全网热榜雷达，覆盖 HackerNews/GitHub/微博/知乎/36氪，按热度倒序，仅保留 AI 相关条目。

1. tinyhumansai/openhuman🔥 3973

来源：⚫ GitHub Trending

2. rohitg00/agentmemory🔥 1609

来源：⚫ GitHub Trending

3. I’ve joined Anthropic🔥 1207

来源：🟡 HackerNews

4. msitarzewski/agency-agents🔥 1120

来源：⚫ GitHub Trending

5. rtk-ai/rtk🔥 704

来源：⚫ GitHub Trending

6. Gemini 3.5 Flash🔥 623

来源：🟡 HackerNews

7. Show HN: Forge – Guardrails take an 8B model from 53% to 99% on agentic tasks🔥 311

来源：🟡 HackerNews

8. Railway Blocked by Google Cloud🔥 226

来源：🟡 HackerNews

9. OpenAI Adopts Google's SynthID Watermark for AI Images with Verification Tool🔥 216

来源：🟡 HackerNews

10. Mistral AI acquires Emmi AI🔥 179

来源：🟡 HackerNews

🔭 明日看点

接下来两周的看点：巨头之间的算力同盟、开源生态的二次爆发、新形态 AI 硬件的出货。

觉得有用？转发给正在关注 AI 的朋友 🚀

每天 10:10 · AI 圈全景速读 · 关注不迷路

🤖 AI工具自由之路 · 每日 AI 速览

由「AI工具自由之路」编辑团队整理与点评 · 每天 10:10 更新