💡 AI HOT 精选日报 · 2026-05-14 · 共 24 条
模型发布/更新
1.Hy3预览版登陆GMI,开源最强模型领跑 — X:腾讯混元 (@TencentHunyuan)
Hy3 预览版已经在 GMI Cloud 上线了。
2.Krea 2发布访问码,限量体验 — X:Krea AI (@krea_ai)
Krea 2 开始发放访问码了。K2-PRFUF8 / K2-NRWW9E / K2-CAP48S 三个码各能用 50 次。这是 Krea 自研的第一个基础模型,从头训练,侧重美学多样性和风格可控性。
3.SenseNova-U1 技术报告深度发布:前沿原生多模态模型构建全指南 — X:商汤 SenseTime (@SenseTime_AI)
商汤公开了 SenseNova-U1 的技术报告,详细讲了怎么构建原生多模态模型:统一建模、无损视觉接口、自回归与像素空间流匹配联合训练、原生 MoE 骨干网络都有涉及。报告给出了六阶段训练方案和强化学习后训练的完整流程。开源版 SenseNova-U1-A3B-MoT 只激活 3B 参数,效率不错。代码、权重、演示都放出来了。
4.AI角色实现记忆共情与主动交互 — X:阿里云 / Alibaba Cloud (@alibaba_cloud)
阿里云发布了 Qwen-Character,能做记忆、共情和主动交互的 AI 角色。游戏、虚拟伴侣、自适应学习场景都能用,参与度可以提高 50% 以上。
产品发布/更新
5.Anthropic推出面向小型企业的Claude服务包 — Anthropic:Newsroom(网页)
Anthropic 上线了 “Claude for Small Business” 服务包,帮小企业补上 AI 应用这块的短板。产品带了不少预置连接器和 15 个开箱即用的自动化工作流,能跟 QuickBooks、PayPal、HubSpot 这些日常工具打通。自动处理的活儿包括薪资规划、月末结算、发票追踪、营销分析。用户通过 Claude Cowork 界面操作,关键步骤需要手动确认,Anthropic 承诺保障数据安全。
6.Introducing Runway Agent — Runway:News(网页)
Runway 发布了 Runway Agent,能从单次对话直接生成完整可发布视频的工具。说清楚需求就行,Agent 自己搞定概念提案、故事节奏、视觉方向,最后输出带多场景、旁白、对话和音乐的成片。面向品牌团队、营销人员、创意机构和电影人,原本几天几周的活儿压缩到几分钟。有免费计划,送 1500 积分。
7.Codex应用内浏览器升级,提升多视口测试与标注效率 — X:Tibo (@thsottiaux)
Codex 的应用内浏览器更新了,现在能在不同视口尺寸下测应用,控制设备工具栏,在不同断点做点击验证。长时间测试会在关键节点截图让人检查。隐藏浏览器关掉动画,测试速度能提升 1-2 倍。标注功能也更快、更省 token 了。
8.全球首个全AI运营的在线广播电台上线,24小时不间断播报AI动态 — X:Kim (@kimmonismus)
全球第一个纯 AI 运营的在线广播电台在 X 上开播了,面向创业者和开发者,全天播 AI 资讯。五个 AI 主播各有独立的编辑判断、记忆和个性,能播突发新闻,每半小时做一次新闻综述,还追踪融资、分析 GitHub 工具趋势。AI 主播不只是念数据,还会找信息之间的矛盾、形成论点、实时辩论。背景音乐也不吵,适合一边干活一边听。
9.无需注册付费,Telegram内一键启动AI智能体 — X:Berry Xia (@berryxia)
Browser Use 把 AI Agent 做到即用即走了。BuxFather 在 Telegram 里直接就能启动 agent,不用注册不用付费,24/7 自主运行,能自我改进,带隐身浏览器。点几下就有了完整的电脑加浏览器环境。重度 Telegram 用户应该会很受用。
10.Claude付费计划将提供月度编程使用额度 — X:Claude Devs (@ClaudeDevs)
从 6 月 15 日起,付费 Claude 用户可以申领专门的月度编程使用额度,涵盖 Claude Agent SDK、claude -p、Claude Code GitHub Actions 和基于 Agent SDK 的第三方应用。
11.Miaoda应用与企业版上线,自生成代码占比90% — X:百度 Baidu (@Baidu_Inc)
百度发布了 Miaoda 应用和企业版。有意思的是,Miaoda 自己 90% 的代码就是自己生成的。编程助手让按需定制软件变得商业上可行了。到现在 Miaoda 生成的软件已服务超 1000 万用户,应用总价值 50 亿人民币。
12.Runway Agent — Runway:Changelog(网页)
Runway Agent 把视频编辑、图像生成、3D 建模这些 AI 工具整合到一个平台,从构思到出片都在一个工作流里完成,降低了专业内容制作的门槛。
行业动态
13.消息称 Anthropic 正就以超 9000 亿美元投前估值筹集至少 300 亿美元谈判 — IT之家(RSS)
Anthropic 据说正在谈新一轮融资,目标投前估值超 9000 亿美元,至少融 300 亿。如果成了就是他们史上最大的一轮。交易最快本月内完成。今年 2 月他们刚融了 300 亿的 G 轮(投后估值 3800 亿),谷歌和亚马逊还承诺了 150 亿。钱大概率用来应对算力成本。公司还计划今年晚些时候 IPO。
14.Anthropic 首次在 B2B 采用率上超越 OpenAI,Ramp 支出数据显示 — The Decoder:AI News(RSS)
根据 Ramp AI 指数,Anthropic 在美国企业客户中的采用率达到 34.4%,第一次超过 OpenAI 的 32.3%。一年里业务覆盖翻了四倍。不过文章分析,三个因素可能让这个领先优势很快消失。
15.Kling AI将亮相2026戛纳探讨AI电影制作 — X:可灵 Kling AI (@Kling_ai)
可灵 Kling AI 要在 5 月 18 日的戛纳电影节上办专场活动,聊 AI 辅助电影制作的现状和未来。他们已经在《House of David》《Born of the Tide》《RAPHAEL》等项目里展示了 AI 在好莱坞级制作、全 AI 动画和剧情长片中的应用。
论文研究
16.ExploitGym:AI智能体能否将安全漏洞转化为真实攻击? — Berkeley RDI:Blog(AI 安全与评测)
伯克利 RDI、马克斯·普朗克研究所、Anthropic、OpenAI、谷歌的研究人员一起发布了 ExploitGym,一个包含 898 个真实漏洞的基准测试,看 AI 能不能根据漏洞描述写出完整的利用程序。结果显示前沿模型已经能成功利用不少漏洞,开了 ASLR 等标准防御之后部分攻击仍能得手。这说明 AI 已经能把漏洞变成实际攻击了——对防御者可以用来评估漏洞严重性,但也降低了攻击门槛。
技巧与观点
17.BestBlogs早报:AI智能体工程化实战与安全架构 — X:洪明 (@hongming731)
BestBlogs 早报这期聚焦 AI Agent 的工程化落地。Anthropic 讲了 Claude Computer Use 的最佳实践,包括解决点击偏移、推荐分辨率策略,以及必须用虚拟机隔离和人工确认的安全措施。OpenAI 工程师分享了给 Codex 构建 Windows 安全沙箱的经验。早报还指出,有些在基准测试里表现很好的 RAG Agent,到生产环境里幻觉率可能到 30%。
18.人形机器人已能自主完成8小时轮班 — X:Kim (@kimmonismus)
人形机器人已经能完全自主地完成 8 小时轮班,达到人类绩效水平。用的是 Helix-02。
19.oMLX更新强化苹果端侧AI,本地能力直逼云端 — X:Berry Xia (@berryxia)
oMLX 更新到 0.3.9.dev2 了,集成了 Gemma 4 的 MTP 视觉路径、DFlash 引擎和 ParoQuant 技术,图文处理速度明显提升。新增一键启动 copilot,能接 Claude 等工具,还通过 oQ 自动代理解决了显存瓶颈。本地 AI 在速度、集成和易用性上又进了一步。
20.Claude 电脑与浏览器使用的最佳实践 — Claude:Blog(网页)
Claude 官方博客发了电脑和浏览器使用能力的最佳实践,针对 4.6 系列和 Opus 4.7。核心建议是优化截图分辨率:4.6 系列最大长边 1568 像素、总像素 115 万;Opus 4.7 长边可到 2576 像素、总像素 375 万。发截图前缩放到限制以内是提升点击准确率最有效的方法。推荐从 1280x720 起步,Opus 4.7 用户优先用 1080p。
21.BenchLoop:本地大模型一键基准测试与排行榜发布 — X:Berry Xia (@berryxia)
BenchLoop 让本地大模型的基准测试变得简单了。拉个模型跑一下,就能看到质量、速度和可靠性的综合评分。还支持对比不同提示框架的表现。测试结果能自动发到公开排行榜上。
22.Meta首席AI官官宣WhatsApp和Meta AI推出Incognito Chat — X:阿易 AI Notes (@AYi_AInotes)
Meta 的 AI 负责人宣布 Incognito Chat 登陆 WhatsApp 和 Meta AI。跟 ChatGPT 那种只不保存历史记录的临时聊天不同,这个功能的对话推理在手机硬件安全飞地里跑,Meta 工程师拿不到明文,不产生服务器日志,会话结束数据永久消失。相当于在 AI 对话上也用上了 WhatsApp 那套端到端加密。作者认为这种隐私保护模式会成为 AI 产品的标配。
23.开源psql_bm25s,让PostgreSQL多智能体检索提速23倍 — X:Emad Mostaque (@EMostaque)
做多智能体系统时,PostgreSQL 虽然可靠但检索速度不够。开发团队开源了 psql_bm25s,一个原生的 PostgreSQL 访问方法,实现了精确的 BM25 检索。标准基准测试里比 pg_search 快大约 23 倍,检索不再是瓶颈了。
24.利用搜索垫图提升AI绘画准确性与质量 — X:歸藏 (@op7418)
用 AI 生成涉及冷门知识的配图时,可以先让 AI 搜索相关图片做参考,再基于参考图生成新图。这个方法能保证图像真实性,还能出高清图。比如云南甲马符这种 AI 不太了解的东西,垫图之后就能画准了。
📬 每日 AI 资讯精选 · 数据来源 [AI HOT](https://aihot.virxact.com)
夜雨聆风