今日要点
- •语音交互产品更新活跃:StepAudio 2.5 Realtime 发布,主打副语言感知与可配置人格化交互。
- •开发者工具链继续自动化:Replit Agent 与 Squidler 集成,打通“构建—测试—修复”闭环。
- •行业层面出现成本与招聘新信号:微软指出部分场景下 AI 使用成本高于人工;多家企业正因 AI 调整入门级岗位招聘。
- •资本与产业布局持续推进:Anthropic 融资消息引发关注,Mistral AI 收购 Emmi AI 布局工业 AI。
- •研究方向聚焦生成效率:NVIDIA 发布 Nemotron-Labs 扩散语言模型相关技术博客,强调高速文本生成。
产品发布/更新
StepAudio 2.5 Realtime:副语言感知与人格化交互
- •StepAudio 2.5 Realtime 是一款实时语音模型。
- •可理解用户语音中的语气、语速、停顿、微表情等副语言特征。
- •支持通过 API 接入自定义人格,可设定个性、背景故事和语言风格。
- •提供上万种原生人格选项,可组合出数百万种特征。
- •内置 5 个可直接体验的预设人格。
- •经 RLHF 调优,在复杂角色扮演压力测试中保持角色一致性。
- •支持中文和英文。
来源:X:阶跃星辰 StepFun (@StepFun_ai)
链接:https://x.com/StepFun_ai/status/2058303294544425197
Models.dev:AI 模型规格、定价和功能的开源数据库
- •Models.dev 是一个新发布的开源数据库,收录 AI 模型的规格、定价及功能信息。
- •项目已在 GitHub 公开,便于开发者查询和比较不同模型。
- •在 Hacker News 社区获得 101 点关注度。
来源:Hacker News 热门(buzzing.cc 中文翻译)
链接:https://github.com/anomalyco/models.dev
Replit Agent × Squidler:全自动化 AI 质量保障
- •Replit Agent 与 Squidler 完成集成。
- •用户可用自然语言描述应用功能,由 Replit Agent 负责构建。
- •构建完成后,Squidler 会像真实用户一样对线上应用进行自动化测试,无需编写测试脚本。
- •测试发现的问题会自动反馈给 Replit Agent 进行修复。
- •该流程已通过 Squidler 加入 Replit 的 MCP 库正式上线。
来源:X:Replit (@Replit)
链接:https://x.com/Replit/status/2058261705998602548
Claude Code v2.1.150
- •此次版本更新包含内部基础设施优化。
- •未引入用户可见的功能、界面或体验变更。
来源:Claude Code:GitHub Releases(RSS)
链接:https://github.com/anthropics/claude-code/releases/tag/v2.1.150
行业动态
AI 成本:微软称部分场景下高于人工
- •微软报告指出,在特定工作场景中,部署和使用 AI 的成本目前高于支付相应人工工资。
- •报告分析了基于 tokens 和 agents 的 AI 使用模式。
- •结论显示,其综合开销超过雇佣人类员工完成同类任务的费用。
来源:Hacker News 热门(buzzing.cc 中文翻译)
链接:https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tokens-agents
Anthropic 融资消息受关注
- •据彭博社报道,Anthropic 最快可能于下周完成一轮逾 300 亿美元融资。
- •报道称,此轮融资将使其估值突破 9000 亿美元,并超过 OpenAI。
- •同时提到,公司第二季度营收预计达 109 亿美元,环比增长超一倍,并有望迎来首个盈利季度。
来源:IT之家(RSS)
链接:https://www.ithome.com/0/954/452.htm
AI 正影响入门级岗位招聘
- •奥纬咨询研究显示,AI 工具正被广泛用于入门级任务。
- •科技行业受裁员冲击最重,74% CEO 已冻结或缩减招聘。
- •计划削减初级岗位的比例从 17% 升至 43%。
- •招聘转向中层岗位的比例升至 30%。
- •报告同时指出,尽管超 90% 企业在部署 AI,多数仍处于试点阶段。
来源:IT之家(RSS)
链接:https://www.ithome.com/0/954/235.htm
Mistral AI 收购 Emmi AI,布局工业 AI
- •Mistral AI 宣布与 Emmi AI 达成最终收购协议。
- •目标是加强其在工业 AI领域的领导地位。
- •Emmi AI 在物理仿真与数字孪生方面的专长将被整合进 Mistral AI 工程解决方案。
- •Emmi AI 的 30 余名研究员与工程师将加入 Mistral AI。
- •合作面向航空航天、汽车等高风险行业的实时仿真与复杂问题解决平台。
来源:Mistral AI:News(网页)
链接:https://mistral.ai/news/science-to-win-industrial-ai
Kling AI 亮相戛纳电影市场
- •Kling AI 在戛纳电影市场(Marché du Film)举办官方会议。
- •会议聚焦 AI 如何融入实际电影制作流程。
- •官方称,其能力已服务于动画长片、好莱坞剧集、实验短片及影院电影等多种创作形式。
来源:X:可灵 Kling AI (@Kling_ai)
链接:https://x.com/Kling_ai/status/2058013861404684739
Google DeepMind 扩大与新加坡合作
- •Google DeepMind 表示,正在扩大与新加坡的合作,以帮助安全地大规模部署 AI。
- •新项目重点包括:
- •加速科学发现
- •加强大流行病防范
- •改善医疗保健
来源:X:Google DeepMind (@GoogleDeepMind)
链接:https://x.com/GoogleDeepMind/status/2057985225100235022
更多信息:https://goo.gle/49jGwjv
论文研究
Nemotron-Labs 扩散语言模型:强调高速文本生成
- •NVIDIA 在 Hugging Face 发布了关于 Nemotron-Labs 扩散语言模型的技术博客。
- •研究聚焦于通过扩散语言模型架构提升文本生成速度。
- •目标是逼近“光速级”生成效率。
- •相关内容强调其相较传统自回归模型,可能在延迟和吞吐量方面具备优势。
来源:Hugging Face:Blog(RSS)
链接:https://huggingface.co/blog/nvidia/nemotron-labs-diffusion
技巧与观点
飞书-Claude Code 桥接开源项目
- •
feishu-claude-code-bridge是一个开源项目,可实现飞书与本机 Claude Code CLI 的双向连接。 - •用户可从飞书消息中直接指挥 Claude Code 执行任务。
- •Claude 也可读取飞书工作上下文,并创建、编辑飞书文档。
- •工作原理是将飞书消息转为 Prompt,经命令行调用 Claude CLI,再将流式输出同步回飞书。
- •该模式还可扩展连接 Codex 等其他本地工具。
- •备注:自 2026 年 6 月 15 日起,Claude 订阅计划对
claude -p模式将独立计费。
来源:X:宝玉 (@dotey)
链接:https://x.com/dotey/status/2058084478459826432
来源:AIHOT
夜雨聆风