AI HOT 日报 · 2026-05-14

💡 AI HOT 精选日报 · 2026-05-14 · 共 24 条

模型发布/更新

1.Hy3预览版登陆GMI，开源最强模型领跑 — X：腾讯混元 (@TencentHunyuan)

Hy3 预览版已经在 GMI Cloud 上线了。

2.Krea 2发布访问码，限量体验 — X：Krea AI (@krea_ai)

Krea 2 开始发放访问码了。K2-PRFUF8 / K2-NRWW9E / K2-CAP48S 三个码各能用 50 次。这是 Krea 自研的第一个基础模型，从头训练，侧重美学多样性和风格可控性。

3.SenseNova-U1 技术报告深度发布：前沿原生多模态模型构建全指南 — X：商汤 SenseTime (@SenseTime_AI)

商汤公开了 SenseNova-U1 的技术报告，详细讲了怎么构建原生多模态模型：统一建模、无损视觉接口、自回归与像素空间流匹配联合训练、原生 MoE 骨干网络都有涉及。报告给出了六阶段训练方案和强化学习后训练的完整流程。开源版 SenseNova-U1-A3B-MoT 只激活 3B 参数，效率不错。代码、权重、演示都放出来了。

4.AI角色实现记忆共情与主动交互 — X：阿里云 / Alibaba Cloud (@alibaba_cloud)

阿里云发布了 Qwen-Character，能做记忆、共情和主动交互的 AI 角色。游戏、虚拟伴侣、自适应学习场景都能用，参与度可以提高 50% 以上。

产品发布/更新

5.Anthropic推出面向小型企业的Claude服务包 — Anthropic：Newsroom（网页）

Anthropic 上线了 “Claude for Small Business” 服务包，帮小企业补上 AI 应用这块的短板。产品带了不少预置连接器和 15 个开箱即用的自动化工作流，能跟 QuickBooks、PayPal、HubSpot 这些日常工具打通。自动处理的活儿包括薪资规划、月末结算、发票追踪、营销分析。用户通过 Claude Cowork 界面操作，关键步骤需要手动确认，Anthropic 承诺保障数据安全。

6.Introducing Runway Agent — Runway：News（网页）

Runway 发布了 Runway Agent，能从单次对话直接生成完整可发布视频的工具。说清楚需求就行，Agent 自己搞定概念提案、故事节奏、视觉方向，最后输出带多场景、旁白、对话和音乐的成片。面向品牌团队、营销人员、创意机构和电影人，原本几天几周的活儿压缩到几分钟。有免费计划，送 1500 积分。

7.Codex应用内浏览器升级，提升多视口测试与标注效率 — X：Tibo (@thsottiaux)

Codex 的应用内浏览器更新了，现在能在不同视口尺寸下测应用，控制设备工具栏，在不同断点做点击验证。长时间测试会在关键节点截图让人检查。隐藏浏览器关掉动画，测试速度能提升 1-2 倍。标注功能也更快、更省 token 了。

8.全球首个全AI运营的在线广播电台上线，24小时不间断播报AI动态 — X：Kim (@kimmonismus)

全球第一个纯 AI 运营的在线广播电台在 X 上开播了，面向创业者和开发者，全天播 AI 资讯。五个 AI 主播各有独立的编辑判断、记忆和个性，能播突发新闻，每半小时做一次新闻综述，还追踪融资、分析 GitHub 工具趋势。AI 主播不只是念数据，还会找信息之间的矛盾、形成论点、实时辩论。背景音乐也不吵，适合一边干活一边听。

9.无需注册付费，Telegram内一键启动AI智能体 — X：Berry Xia (@berryxia)

Browser Use 把 AI Agent 做到即用即走了。BuxFather 在 Telegram 里直接就能启动 agent，不用注册不用付费，24/7 自主运行，能自我改进，带隐身浏览器。点几下就有了完整的电脑加浏览器环境。重度 Telegram 用户应该会很受用。

10.Claude付费计划将提供月度编程使用额度 — X：Claude Devs (@ClaudeDevs)

从 6 月 15 日起，付费 Claude 用户可以申领专门的月度编程使用额度，涵盖 Claude Agent SDK、claude -p、Claude Code GitHub Actions 和基于 Agent SDK 的第三方应用。

11.Miaoda应用与企业版上线，自生成代码占比90% — X：百度 Baidu (@Baidu_Inc)

百度发布了 Miaoda 应用和企业版。有意思的是，Miaoda 自己 90% 的代码就是自己生成的。编程助手让按需定制软件变得商业上可行了。到现在 Miaoda 生成的软件已服务超 1000 万用户，应用总价值 50 亿人民币。

12.Runway Agent — Runway：Changelog（网页）

Runway Agent 把视频编辑、图像生成、3D 建模这些 AI 工具整合到一个平台，从构思到出片都在一个工作流里完成，降低了专业内容制作的门槛。

行业动态

13.消息称 Anthropic 正就以超 9000 亿美元投前估值筹集至少 300 亿美元谈判 — IT之家（RSS）

Anthropic 据说正在谈新一轮融资，目标投前估值超 9000 亿美元，至少融 300 亿。如果成了就是他们史上最大的一轮。交易最快本月内完成。今年 2 月他们刚融了 300 亿的 G 轮（投后估值 3800 亿），谷歌和亚马逊还承诺了 150 亿。钱大概率用来应对算力成本。公司还计划今年晚些时候 IPO。

14.Anthropic 首次在 B2B 采用率上超越 OpenAI，Ramp 支出数据显示 — The Decoder：AI News（RSS）

根据 Ramp AI 指数，Anthropic 在美国企业客户中的采用率达到 34.4%，第一次超过 OpenAI 的 32.3%。一年里业务覆盖翻了四倍。不过文章分析，三个因素可能让这个领先优势很快消失。

15.Kling AI将亮相2026戛纳探讨AI电影制作 — X：可灵 Kling AI (@Kling_ai)

可灵 Kling AI 要在 5 月 18 日的戛纳电影节上办专场活动，聊 AI 辅助电影制作的现状和未来。他们已经在《House of David》《Born of the Tide》《RAPHAEL》等项目里展示了 AI 在好莱坞级制作、全 AI 动画和剧情长片中的应用。

论文研究

16.ExploitGym：AI智能体能否将安全漏洞转化为真实攻击？ — Berkeley RDI：Blog（AI 安全与评测）

伯克利 RDI、马克斯·普朗克研究所、Anthropic、OpenAI、谷歌的研究人员一起发布了 ExploitGym，一个包含 898 个真实漏洞的基准测试，看 AI 能不能根据漏洞描述写出完整的利用程序。结果显示前沿模型已经能成功利用不少漏洞，开了 ASLR 等标准防御之后部分攻击仍能得手。这说明 AI 已经能把漏洞变成实际攻击了——对防御者可以用来评估漏洞严重性，但也降低了攻击门槛。

技巧与观点

17.BestBlogs早报：AI智能体工程化实战与安全架构 — X：洪明 (@hongming731)

BestBlogs 早报这期聚焦 AI Agent 的工程化落地。Anthropic 讲了 Claude Computer Use 的最佳实践，包括解决点击偏移、推荐分辨率策略，以及必须用虚拟机隔离和人工确认的安全措施。OpenAI 工程师分享了给 Codex 构建 Windows 安全沙箱的经验。早报还指出，有些在基准测试里表现很好的 RAG Agent，到生产环境里幻觉率可能到 30%。

18.人形机器人已能自主完成8小时轮班 — X：Kim (@kimmonismus)

人形机器人已经能完全自主地完成 8 小时轮班，达到人类绩效水平。用的是 Helix-02。

19.oMLX更新强化苹果端侧AI，本地能力直逼云端 — X：Berry Xia (@berryxia)

oMLX 更新到 0.3.9.dev2 了，集成了 Gemma 4 的 MTP 视觉路径、DFlash 引擎和 ParoQuant 技术，图文处理速度明显提升。新增一键启动 copilot，能接 Claude 等工具，还通过 oQ 自动代理解决了显存瓶颈。本地 AI 在速度、集成和易用性上又进了一步。

20.Claude 电脑与浏览器使用的最佳实践 — Claude：Blog（网页）

Claude 官方博客发了电脑和浏览器使用能力的最佳实践，针对 4.6 系列和 Opus 4.7。核心建议是优化截图分辨率：4.6 系列最大长边 1568 像素、总像素 115 万；Opus 4.7 长边可到 2576 像素、总像素 375 万。发截图前缩放到限制以内是提升点击准确率最有效的方法。推荐从 1280x720 起步，Opus 4.7 用户优先用 1080p。

21.BenchLoop：本地大模型一键基准测试与排行榜发布 — X：Berry Xia (@berryxia)

BenchLoop 让本地大模型的基准测试变得简单了。拉个模型跑一下，就能看到质量、速度和可靠性的综合评分。还支持对比不同提示框架的表现。测试结果能自动发到公开排行榜上。

22.Meta首席AI官官宣WhatsApp和Meta AI推出Incognito Chat — X：阿易 AI Notes (@AYi_AInotes)

Meta 的 AI 负责人宣布 Incognito Chat 登陆 WhatsApp 和 Meta AI。跟 ChatGPT 那种只不保存历史记录的临时聊天不同，这个功能的对话推理在手机硬件安全飞地里跑，Meta 工程师拿不到明文，不产生服务器日志，会话结束数据永久消失。相当于在 AI 对话上也用上了 WhatsApp 那套端到端加密。作者认为这种隐私保护模式会成为 AI 产品的标配。

23.开源psql_bm25s，让PostgreSQL多智能体检索提速23倍 — X：Emad Mostaque (@EMostaque)

做多智能体系统时，PostgreSQL 虽然可靠但检索速度不够。开发团队开源了 psql_bm25s，一个原生的 PostgreSQL 访问方法，实现了精确的 BM25 检索。标准基准测试里比 pg_search 快大约 23 倍，检索不再是瓶颈了。

24.利用搜索垫图提升AI绘画准确性与质量 — X：歸藏 (@op7418)

用 AI 生成涉及冷门知识的配图时，可以先让 AI 搜索相关图片做参考，再基于参考图生成新图。这个方法能保证图像真实性，还能出高清图。比如云南甲马符这种 AI 不太了解的东西，垫图之后就能画准了。

📬 每日 AI 资讯精选 · 数据来源 [AI HOT](https://aihot.virxact.com)