AI+DB 早报
2026年05月23日 · AI+DB 早报 22 条
AI+DB 早报 · 22 条
1.Cerebras 晶圆级芯片运行 Kimi K2.6 万亿参数模型,推理速度达 981 tok/s,比 GPU 云快 6.7 倍
Cerebras 宣布在其 CS-3 系统上运行 Moonshot AI 的 Kimi K2.6(1T 参数 MoE 模型,384 个专家,256K 上下文窗口),实测每秒 981 个输出 token,比最快的 GPU 云提供快 6.7 倍,比中位数快 23 倍。独立第三方 Artificial Analysis 验证了这些数据。500 token 响应总耗时仅 5.6 秒,而 Kimi 官方端点需 163.7 秒,提升 29 倍。Cerebras 刚以 950 亿美元估值完成 IPO,募资 55.5 亿美元。
原文: https://venturebeat.com/technology/cerebras-says-its-chips-run-a-trillion-parameter-ai-model-nearly-7-times-faster-than-gpu-clouds
2.Cohere 发布 Command A+ 开源模型:218B MoE 架构,Apache 2.0 许可证,W4A4 近无损量化
Cohere 发布首个完全 Apache 2.0 许可的开源模型 Command A+,218B 总参数仅 25B 激活,采用解码器端 MoE 架构。亮点包括行业领先的 W4A4 量化技术(量化专家网络但保持注意力通路全精度),可在单张 NVIDIA B200 或两张 H100 上运行,输出速度 375 tok/s。新分词器原生支持 48 种语言,阿拉伯语减少 20% token。模型在 τ²-Bench Telecom 从 37% 升至 85%,AIME 25 达 90%。还支持原生引用生成和多模态处理。
原文: https://venturebeat.com/technology/cohere-cracks-lossless-quantization-and-native-citations-with-first-full-apache-2-0-licensed-open-model-command-a
3.Google 发布 Gemini 3.5 Flash:全面超越 3.1 Pro,输出速度快 4 倍
Google I/O 上发布了 Gemini 3.5 Flash,在几乎所有 benchmark 上超越前代旗舰 Gemini 3.1 Pro,同时输出 tokens 速度是同级前沿模型的 4 倍。Pichai 称其在 Artificial Analysis 的"智能-速度"象限中独占右上角。该模型将驱动 Google 全新统一的搜索体验。Google 同时宣布 2026 年资本支出预计达 1800-1900 亿美元。
原文: https://venturebeat.com/technology/google-just-redesigned-the-search-box-for-the-first-time-in-25-years-heres-why-it-matters-more-than-you-think
4.DelTA:判别式 Token 信用分配方法提升 RLVR 训练效果,数学基准平均提升 3.26 分
人大提出 DelTA 方法,解决强化学习从可验证奖励(RLVR)中 token 级别信用分配问题。该方法通过估计 token 系数来放大侧特定 token 梯度方向、抑制共享或弱判别性 token,在 7 个数学基准上,Qwen3-8B-Base 平均提升 3.26 分,Qwen3-14B-Base 提升 2.62 分。方法在代码生成、不同主干模型和域外评估上均表现出良好泛化性。代码已开源。
原文: https://huggingface.co/papers/2605.21467
5.Resolve AI 发布多 Agent 协同调查系统,根因准确率翻倍
由 Greylock 和 Lightspeed 支持的 Resolve AI 发布平台重大升级:引入多 Agent 协同调查架构,由专门的 Agent 团队并行追踪多条假设、相互验证结论、构建完整因果链。内部基准显示根因准确率提升超过 2 倍。同时推出始终在线的后台 Agent(监控部署、审计告警、标记成本异常),以及工程师与 AI 共享的调查工作区。已有 Coinbase、Salesforce、DoorDash、Zscaler 等客户,DoorDash 根因定位时间减少 87%。
原文: https://venturebeat.com/technology/resolve-ai-says-the-ai-coding-boom-is-breaking-production-systems-it-wants-to-fix-that
6.Google 重新设计搜索框:合并 AI Overviews 与 AI Mode,支持多模态输入
Google 在 I/O 发布 25 年来最大搜索框改版:将 AI Overviews 与 AI Mode 合并为统一体验,搜索框可接受文字、图片、PDF、视频甚至 Chrome 标签页作为输入。AI Mode 月活用户突破 10 亿,查询量每季度翻倍。新搜索框由 Gemini 3.5 Flash 驱动,支持动态生成交互式可视化("生成式 UI"),还引入了可按条件主动监控网页的"信息 Agent"。
原文: https://venturebeat.com/technology/google-just-redesigned-the-search-box-for-the-first-time-in-25-years-heres-why-it-matters-more-than-you-think
7.Google 推出 Managed Agents API:一次调用即可部署 AI Agent
Google 在 Gemini API 中发布 Managed Agents,将 Agent 部署从数周压缩至一次 API 调用。该服务通过 Google AI Studio 的自定义模板提供预览版,在 Google 管理的安全环境中运行,将模型、执行层和沙箱进行垂直整合优化。与 Anthropic 的模型层编排策略和 AWS 的授权层策略不同,Google 选择了最深的垂直整合路线。
原文: https://venturebeat.com/orchestration/googles-managed-agents-api-promises-one-call-deployment-at-the-cost-of-execution-layer-control
8.Corti 发布临床级语音识别模型:医学术语错误率 1.4%,比 OpenAI 低 16 个百分点
哥本哈根医疗 AI 公司 Corti 推出 Symphony for Speech-to-Text,在英文医学术语上词错率(WER)仅 1.4%,而 OpenAI 语音模型为 17.7%、Whisper 为 17.4%。临床实体召回率达 98.3%,通用模型最佳仅 44.3%。在德语和法语医学环境也大幅领先,且超越传统医用听写工具 Dragon Medical One(4.6% vs 5.7% WER)。Corti 已服务超过 1 亿患者/年,覆盖英国 NHS 等主要医疗系统。
原文: https://venturebeat.com/technology/cortis-new-symphony-for-speech-to-text-model-beats-openai-at-medical-terminology-accuracy-highlighting-the-value-of-specialized-ai
9.东京大学提出 MM-OCEAN 基准:27 个 MLLM 评测揭示"偏见鸿沟"
研究人员发布 Grounded Personality Reasoning (GPR) 任务和 MM-OCEAN 数据集(1104 个视频,5320 道多选题),评测 27 个多模态大模型(13 个闭源、14 个开源)的人格推理能力。发现"偏见鸿沟":51% 的正确评分并非基于检索到的行为线索,全领域 Holistic-Grounding Rate 仅 0-33.5%。论文提出了偏见率、虚构率等四类失败模式指标。
原文: https://huggingface.co/papers/2605.22109
10.Rippletide 提出决策上下文图:解决企业 AI Agent"遗忘"问题
基于 Neo4j 生态的初创公司 Rippletide 提出决策上下文图框架,通过结构化编码适用性规则、时间感知记忆和决策路径,使 AI Agent 实现"非回归"学习——冻结已验证的行为序列并在此之上持续改进。解决传统 RAG "检索文档但不提供决策上下文"的短板,适用于需要 99.999% 可靠性的银行等场景。
原文: https://venturebeat.com/orchestration/enterprise-ai-agents-keep-failing-because-they-forget-what-they-learned
11.Kore.ai 发布 Artemis AI Agent 平台:引入 Agent Blueprint Language 和双脑架构
Kore.ai 推出 Artemis 版本 Agent 平台,核心是编译型声明式语言 ABL(基于 YAML),支持 6 种编排模式;以及"AI 自己设计 AI"的 Arch 系统,将业务需求直接转化为生产级 Agent。最具特色的"双脑架构"将 LLM 推理与确定性业务规则引擎并行运行,专为银行、医疗等受监管行业设计。平台已服务全球 500+ 企业客户,支持 175 种 AI 模型。
原文: https://venturebeat.com/technology/kore-ai-launches-artemis-ai-agent-platform-expands-challenge-to-microsoft-and-salesforce
12.Anthropic 告知投资者即将实现首次盈利,Q2 营收将翻倍至约 109 亿美元
Anthropic 向投资者透露,第二季度营收将超过翻倍至约 109 亿美元,即将实现公司首个盈利季度。Anthropic 近年一直处于高速增长轨道,但此前持续亏损。这一拐点标志着 AI 基础模型公司开始进入正向盈利周期。
原文: https://techcrunch.com/2026/05/20/anthropic-says-its-about-to-have-its-first-profitable-quarter/
13.Hark 获 7 亿美元 A 轮融资,开发"通用"AI 界面
Hark 宣布完成 7 亿美元 A 轮融资。公司计划今年夏天发布首批多模态模型,打造可与现有产品和服务配合使用的个人 AI 平台,后续还将推出专用硬件设备。该公司目前仍处于相对保密状态。
原文: https://techcrunch.com/2026/05/21/hark-raises-700m-series-a-for-its-secretive-universal-ai-interface/
14.Jensen Huang 称英伟达发现全新 2000 亿美元 CPU 市场
英伟达 CEO 黄仁勋预测,AI Agent 所需的 CPU 将成为英伟达的下一个重大市场,规模达 2000 亿美元。他认为未来 AI Agent 将驱动对专用 CPU 的巨大需求。
原文: https://techcrunch.com/2026/05/20/jensen-huang-says-hes-found-a-brand-new-200b-market-for-nvidia/
15.NanoClaw 开发者获 1200 万美元种子轮,打造企业"第二大脑"
开源 AI Agent 框架 NanoClaw(OpenClaw 的企业级变体)的创建者成立 NanoCo AI,获 1200 万美元超额种子轮,由 Valley Capital Partners 领投。投资者包括 Docker、Vercel、monday.com 和 HuggingFace CEO Clem Delangue。NanoClaw 核心逻辑仅约 500 行 TypeScript,通过 Docker 沙箱实现零信任安全架构,已获超 25 万次下载、近 29000 GitHub stars。
原文: https://venturebeat.com/orchestration/nanoclaws-creators-are-turning-the-secure-open-source-ai-agent-harness-into-an-enterprise-second-brain
16.Google I/O 展示 AI 眼镜原型:Gemini 驱动的实时翻译与导航叠加
Google 在 I/O 展示 Android XR 眼镜原型,可将 Gemini 驱动的翻译、导航等信息直接叠加到视野中。TechCrunch 实测后评价"几乎就绪"。眼镜运行 Android XR 系统,标志着 Google 在可穿戴 AI 设备领域的重要进展。
原文: https://techcrunch.com/2026/05/22/we-tried-googles-ai-glasses-and-theyre-almost-there/
17.TransitLM:高德机器学习团队发布 1300 万条公交路线规划数据集
来自 AMAP-ML 的团队发布 TransitLM,包含来自中国四个城市的 1300 万+公交路线规划记录,覆盖 120845 个站点和 13666 条线路。实验显示 LLM 训练后可生成结构有效的路线,且在无显式地图映射的情况下将 GPS 坐标隐式定位到正确站点。数据集和 benchmark 已开源在 HuggingFace。
原文: https://huggingface.co/papers/2605.22355
18.Spotify 与环球音乐达成 AI 翻唱/remix 协议,Premium 用户可创作 AI 歌曲
Spotify 与环球音乐集团合作,允许 Premium 用户创建 AI 生成的歌曲翻唱和 remix,参与艺人将获得收入分成。此举标志着主流音乐流媒体平台正式拥抱 AI 音乐生成。
原文: https://techcrunch.com/2026/05/21/spotify-and-universal-music-strike-deal-allowing-fan-made-ai-covers-and-remixes/
19.特朗普推迟签署 AI 安全行政令,称措辞"可能构成阻碍"
特朗普总统推迟签署要求对 AI 模型进行政府预发布安全审查的行政令,表示对命令的措辞不满。该行政令本将建立 AI 模型发布前的安全审查机制。
原文: https://techcrunch.com/2026/05/21/trump-delays-ai-security-executive-order-i-dont-want-to-get-in-the-way-of-that-leading/
20.VC 和创始人利用虚增 ARR 来"造王"AI 初创公司
TechCrunch 调查发现部分 AI 初创公司在公开沟通中拉伸传统收入指标,投资人对此心知肚明。文章揭示 AI 行业估值泡沫背后的财务指标操纵现象。
原文: https://techcrunch.com/2026/05/22/how-vcs-and-founders-use-inflated-arr-to-kingmake-ai-startups/
21.Google 搜索 AI 更新后搜索 "disregard" 一词会导致界面崩溃
Google 搜索 AI 更新后,"disregard"(忽视)一词导致搜索界面出现故障,实际上使该词无法正常搜索。反映 AI 搜索在处理特殊指令型关键词时可能出现意外行为。
原文: https://techcrunch.com/2026/05/22/you-can-no-longer-google-the-word-disregard/
22.AI 被用于"复活"空难遇难飞行员的声音
有人利用 AI 从驾驶舱录音的频谱图图像中重建遇难飞行员的声音,迫使 NTSB(美国国家运输安全委员会)暂时封锁其案卷系统访问权限。
原文: https://techcrunch.com/2026/05/22/ai-is-being-used-to-resurrect-the-voices-of-dead-pilots/
夜雨聆风