AI 工具自由之路|DAILY · ISSUE NO.140
2026年05月20日今日 AI 速览
AI 圈全景周三 · 共 34 条精选 · 编辑整理与点评
✍️ 编辑观察
2026年05月20日 AI 圈一共给我们送来 34 条值得一看的消息。其中「模型发布/更新」是今天的绝对主角,一口气贡献了 8 条,信号很明显。紧随其后的「产品发布/更新」也有 8 条,值得顺手扫一眼。信息密度上来了,节奏别乱。先扫版块标题,命中再读正文,三分钟搞定今日 AI。
🧠 模型发布/更新 · 共 8 条
1. I/O 2026: 欢迎来到自主的 Gemini 时代
Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代,新功能使其能够自动执行复杂任务,显著提升用户工作效率。
来源:Google Blog:AI(RSS)
2. 谷歌发布Gemini Omni多模态生成模型
介绍Gemini Omni,我们的新模型,可以从任何输入创建任何内容,首先从视频开始。
来源:X:Gemini (@GeminiApp)
3. Gemini Omni:迈向AGI的世界模型
真正的“哇”时刻是 Gemini Omni。
来源:X:Kim (@kimmonismus)
4. Gemini Omni发布:物理推理与多模态生成新突破
Gemini Omni不仅能构建逼真的场景,还能推理接下来应该发生什么。
来源:X:Sundar Pichai (@sundarpichai)
5. Gemini Omni发布:多模态生成新突破
我们推出Gemini Omni:这是迈向一个能从任何内容生成任何内容的模型的第一步——从视频开始。
来源:X:Google DeepMind (@GoogleDeepMind)
6. 谷歌 Gemini Omni 全能模型发布:可从任意输入生成任意输出,一句话让 …
在2026年谷歌I/O开发者大会上,谷歌正式推出Gemini Omni模型。
来源:IT之家(RSS)
7. Gemini Omni发布,迈向AGI新进展
„迈向AGI的进展“:Gemini Omni - 世界模型 -Gemini Omni官方发布!
来源:X:Kim (@kimmonismus)
8. 首个实时多agent世界模型发布,人类可与AI同屏互动
奥德赛实验室推出Agora-1,这是全球首个实时多agent世界模型,允许多人与AI同时在同一个模拟世界中实时互动并相互影响。
来源:X:Berry Xia (@berryxia)
小编说:新模型很多,但值得上手的永远是少数几个,挑着试。
📱 产品发布/更新 · 共 8 条
9. 谷歌推出全新AI智能搜索框,支持多模态交互
谷歌宣布推出基于Gemini 3.5模型的全新智能搜索框。
来源:X:Google AI (@GoogleAI)
10. Claude智能体托管平台新增自托管沙箱与MCP隧道功能
Anthropic为其Claude智能体托管平台推出两项更新:自托管沙箱允许用户在自有基础设施或合作云平台上运行工具,确保敏感数据与服务保留在用户控制范围内;MCP隧道则通过轻量网关,使智能体能安…
来源:Claude:Blog(网页)
11. Gemini Spark:全天候个人AI代理
Gemini Spark 是您的全天候个人AI代理,帮助您驾驭数字生活。
来源:X:Gemini (@GeminiApp)
12. Google Workspace 推出全新创建方式与高效工作功能
Google 在最新更新中为 Gmail、Docs 和 Keep 增添了新的语音功能,并推出了一款名为 Google Pics 的全新设计工具。
来源:Google Blog:AI(RSS)
13. Ramp利用Gemini API构建高级财务代理
通过使用Gemini API中的新托管代理功能,@Ramp在无需接触后端基础设施的情况下构建了其高级财务代理。
来源:X:Google AI for Developers (@googleaidevs)
14. Gemini Omni助力Google Flow创作电影级故事
Google Flow 🤝 Gemini Omni 使用我们的最新模型创作更具电影感的故事,它带来了批量编辑、改进的角色一致性等功能。
来源:X:Google DeepMind (@GoogleDeepMind)
15. 宣布Claude Managed Agents登陆Cloudflare
Cloudflare宣布与Anthropic的Claude Managed Agents深度整合,提供快速、隔离的自主代码交付执行环境。
来源:Cloudflare Blog
16. Claude推出自托管沙箱与MCP隧道功能
来自Code with Claude伦敦现场:我们正在Claude Managed Agents中推出自托管沙箱(公测版)和MCP隧道(研究预览版)。
来源:X:Claude (@claudeai)
小编说:别被发布会带节奏,回到自己场景里问一句"我会天天用它吗"。
📰 行业动态 · 共 8 条
17. Karpathy加入Anthropic团队
欢迎加入团队,Andrej!
来源:X:Claude Devs (@ClaudeDevs)
18. 安德烈·卡帕西加入Anthropic
AI领域知名专家安德烈·卡帕西于2026年5月19日宣布加入人工智能安全公司Anthropic。
来源:Hacker News 热门(buzzing.cc 中文翻译)
19. 前OpenAI核心成员Andrej Karpathy选择Anthropic重返前…
著名AI研究人员Andrej Karpathy已加入Anthropic。
来源:The Decoder:AI News(RSS)
20. Google I/O 2026
在Google I/O 2026大会上,Google宣布了多项旨在让AI更普惠、更实用的更新。
来源:Google Blog:AI(RSS)
21. Andrej加入Anthropic,马斯克也点赞
Andrej加入了Anthropic。 连Elon都忍不住称赞Anthropic。 Anthropic今天在Google I/O上真是气场全开。
来源:X:Yuchen Jin (@Yuchenj_UW)
22. 谷歌每月处理超 3200 万亿 Token,同比增长 7 倍
在2026年谷歌I/O开发者大会上,谷歌宣布其AI业务关键指标大幅增长。
来源:IT之家(RSS)
23. Anthropic联合创始人将与教皇利奥十四世共同发布人工智能通谕
Anthropic联合创始人将于2026年5月与教皇利奥十四世共同发布首个人工智能通谕“magnifica humanitas”。
来源:Hacker News 热门(buzzing.cc 中文翻译)
24. Gemini月活用户超9亿,回顾年度重大功能发布
每月有超过9亿用户使用Gemini应用。 这一增长的重要部分源于我们快速的发布节奏。以下是过去一年我们推出的一些最重要功能的回顾。🧵 #GoogleIO
来源:X:Gemini (@GeminiApp)
小编说:别只看谁融了多少钱,看他要用这笔钱抢谁的生意。
📄 论文研究 · 共 2 条
25. 研究发现人类说服技巧对AI同样有效
🚨我们的论文已在PNAS发表:我们发现经典的人类说服技巧以一种“类人”的方式对AI有效,使其同意不当请求(将顺从率从35%提高到51%) 该技巧对一系列主流大语言模型有效,尽管较新的模型抵抗力更强…
来源:X:Ethan Mollick (@emollick)
26. 开源古代汉字视觉感知评估基准Chronicles-OCR
开源了评估视觉大语言模型(VLLM)对古代汉字视觉感知能力的基准测试Chronicles-OCR。
来源:X:腾讯混元 (@TencentHunyuan)
小编说:顶会风向就是下一季产品功能的剧透片。
💡 技巧与观点 · 共 8 条
27. Forge:通过防护机制大幅提升8B模型性能的可靠性层
Forge 是一个为自托管大语言模型设计的可靠性层,专注于提升工具调用能力。
来源:Hacker News:AI 热帖
28. NVIDIA开源首个4-bit超长视频生成基础设施
NVIDIA研究员开源LongLive 2.0,这是首个支持4-bit量化、覆盖训练与推理全流程的端到端长视频生成基础设施。
来源:X:Berry Xia (@berryxia)
29. AI代理集成新方案:Membrane推出单一技能连接万种API
AI代理在实际应用中需为每个外部服务重复构建集成逻辑,成为其发展的主要瓶颈。
来源:X:Rohan Paul (@rohanpaul_ai)
30. Claude Code的HTML输出:非凡的有效性
Claude Code团队正从Markdown转向HTML作为主要输出格式。
来源:Claude:Blog(网页)
31. Claude实现真实界面操作的生产实践指南
计算机使用功能使Claude成为能够操作真实用户界面的智能体。
来源:X:Claude Devs (@ClaudeDevs)
32. ChatGPT图像生成周使用量突破15亿次
人们每周在ChatGPT中生成超过15亿张图像。
来源:X:OpenAI (@OpenAI)
33. DAA:智能体时代的核心指标
这里快速补充一个指标新词:DAA。 全称 Daily Active Agents(每日活跃智能体),相当于智能体时代的 DAU。 如果说代币经济学追踪成本,那么 DAA 追踪产出——智能体实际完成…
来源:X:百度 Baidu (@Baidu_Inc)
34. 拓宽关于前沿AI的对话
Anthropic为构建负责任的先进AI,正与全球多元群体展开对话。
来源:Anthropic:Newsroom(网页)
小编说:AI 用得好不好,差距在"愿不愿意动手试"这一步。
🔥 全网 AI 热议 · 共 10 条
本版块来自全网热榜雷达,覆盖 HackerNews/GitHub/微博/知乎/36氪,按热度倒序,仅保留 AI 相关条目。
1. tinyhumansai/openhuman🔥 3973
来源:⚫ GitHub Trending
2. rohitg00/agentmemory🔥 1609
来源:⚫ GitHub Trending
3. I’ve joined Anthropic🔥 1207
来源:🟡 HackerNews
4. msitarzewski/agency-agents🔥 1120
来源:⚫ GitHub Trending
5. rtk-ai/rtk🔥 704
来源:⚫ GitHub Trending
6. Gemini 3.5 Flash🔥 623
来源:🟡 HackerNews
7. Show HN: Forge – Guardrails take an 8B model from 53% to 99% on agentic tasks🔥 311
来源:🟡 HackerNews
8. Railway Blocked by Google Cloud🔥 226
来源:🟡 HackerNews
9. OpenAI Adopts Google's SynthID Watermark for AI Images with Verification Tool🔥 216
来源:🟡 HackerNews
10. Mistral AI acquires Emmi AI🔥 179
来源:🟡 HackerNews
🔭 明日看点
接下来两周的看点:巨头之间的算力同盟、开源生态的二次爆发、新形态 AI 硬件的出货。
觉得有用?转发给正在关注 AI 的朋友 🚀
每天 10:10 · AI 圈全景速读 · 关注不迷路
🤖 AI工具自由之路 · 每日 AI 速览
由「AI工具自由之路」编辑团队整理与点评 · 每天 10:10 更新
夜雨聆风