OpenAI推出三款实时语音模型

OpenAI推出三款实时语音模型 | AI日报

OpenAI推出三款实时语音模型，覆盖推理对话、翻译与转录场景

5月8日，OpenAI发布三款全新实时语音模型，包括GPT‑Realtime‑2、GPT‑Realtime‑Translate和GPT‑Realtime‑Whisper，均已纳入Realtime API体系。其中GPT‑Realtime‑2定位为首款具备GPT‑5级推理能力的语音模型，支持边思考边对话、处理打断和调用工具；GPT‑Realtime‑Translate支持70+输入语言和13种输出语言的实时翻译；GPT‑Realtime‑Whisper专注于低延迟流式语音转写。定价方面，GPT‑Realtime‑2每百万音频输入Token收费32美元（缓存输入0.40美元）、输出Token收费64美元，翻译与转录模型分别按每分钟0.034美元和0.017美元计费。

中国移动将发布AI-eSIM产品，布局AI终端生态

中国移动在5月7日至9日苏州举办的“2026移动云大会”上正式发布AI-eSIM产品。该产品可实现云端模型的实时调度，让设备具备自主思考和即时响应能力，主要应用于AI玩具、智能穿戴等终端设备。中国移动内部已形成“畅通Agent使用Token、Token拉动算力、算力激发网络流量”的清晰价值链逻辑，标志着运营商正加速向AI基础设施服务商转型

宇树科技开放全球首个人形机器人应用商店UniStore

5月7日，宇树科技宣布其人形机器人官方应用平台UniStore正式全面开放，定位为全球首个人形机器人任务动作应用商店。该平台通过标准化接口与生态建设，允许用户像下载手机App一样获取并安装各类机器人任务动作应用，大幅降低开发与使用门槛。此举旨在推动人形机器人从功能机时代向智能机时代跨越，通过软硬件解耦加速具身智能在工业、服务业等多元场景的规模化落地。

美团公测AI社区“觅游”，推出“养虾”数字生命共生社区

5月7日，美团推出AI原生社区“觅游”，由美团基础研发AI创新产品团队打造，面向所有大模型和Agent产品开放。该社区将“养虾”定义为一种全新生活方式，用户可“养育”专属AI虾，虾能替用户寻找赚钱机会、结识同道伙伴，实现人与AI的协作成长。“觅游”定位为首个让AI Agent拥有身份、关系与成长的共生社区，目前该项目已正式进入公测阶段，已入驻Agent超3000个、技能总数超4万。

OpenAI推出“可信联系人”安全功能

OpenAI于当地时间5月7日宣布新增“可信联系人”安全功能。当自动化系统和经过培训的审核人员检测到成年用户可能曾讨论自残行为且构成安全隐患时，系统将自动通知用户预设的可信联系人。该功能不会取代专业危机干预服务，而是作为补充保障措施，ChatGPT仍会鼓励用户在适当时联系危机热线或紧急服务部门。

Netflix测试AI语音搜索，或成Apple TV AI化样板

Netflix正在测试基于AI的语音搜索功能，测试者反馈“remarkable”。该功能可理解复杂语义请求，如“关于死亡的儿童剧”精准推荐《雷蒙·斯尼奇的不幸历险》，抽象表达“受伤的人伤害别人”也能匹配相关剧集。这项技术预计将随iOS 27的新Siri同步引入秋季发布的Apple TV 4K，使语音搜索跨越自有内容边界，整合HBO Max、Disney+等第三方流媒体服务。

Google AI Overviews新增社区观点与深度探索模块

Google对AI搜索功能进行五项重大更新，AI Overviews将直接整合论坛、社交媒体等真实用户生成内容，并标注“社区观点”标签。同时新增“进一步探索”模块，在AI回答末尾提供延伸阅读链接，并在回答正文中嵌入更多内链。桌面端还支持悬停预览链接来源网站，帮助用户更便捷地探索网页深层内容。

OpenAI为ChatGPT广告推出自助投放与CPC竞价功能

OpenAI正在扩展ChatGPT广告系统，推出自助式广告管理工具、CPC点击竞价模式及转化追踪API。广告主可自助注册、上传广告、设置预算和出价并追踪购买、注册等转化行为。OpenAI强调广告不会影响模型回答内容，且Pro、Business等付费版本保持无广告。此举使ChatGPT向类似Google Ads的广告生态系统迈出关键一步。

阿里千问PC端上线AI语音输入功能，支持上下文智能回复与多场景自动生成回复

据财联社记者从阿里方面获悉，千问在PC端正式上线AI语音输入功能，用户通过快捷键（Windows端右Alt键，Mac端右Command键）即可在微博、QQ邮箱、谷歌浏览器等各类桌面应用中直接调用。该功能支持对口语内容自动去语气词、纠错和格式化整理，能够基于上下文进行智能回复，用户还可直接下达创作、问答、翻译等语音指令。在钉钉、微信或邮件等场景中，用户可要求千问根据上下文自动生成回复，例如中文口述要求即可生成格式正确的英文邮件回复。目前该功能已全面开放，所有用户可通过千问PC端免费使用。

软银与英伟达、鸿海磋商开发“日本制造”AI服务器，最早下周一公布计划

软银已开始与英伟达和鸿海（富士康）进行磋商，评估在日本本土开发制造AI服务器的可行性。软银计划先通过组装外购零部件建立生产体系，到本十年末（约2029年）逐步全面掌控服务器制造流程。该项目将纳入软银的中期经营计划，最快将于5月11日（下周一）正式公布。

欧盟修订《人工智能法案》：明确禁止AI生成深度伪造色情内容，高风险AI监管推迟实施

欧洲议会与欧盟成员国于5月7日达成共识，将通过《人工智能法案》修订条款明确禁止AI系统生成“深度伪造”色情内容，首次从立法层面划定“脱衣换脸”类应用的红线。同时，针对高风险AI系统的监管规定实施时间被推迟：独立AI系统从2026年8月延至2027年12月，嵌入其他产品的AI工具从2027年8月延至2028年8月。欧盟委员会表示，调整旨在帮助企业适应监管、避免抑制创新。

CoreWeave财报不及预期盘后暴跌，AI算力赛道隐忧浮现

美国AI云计算基础设施公司CoreWeave于5月7日盘后发布财报，一季度GAAP净亏损达7.40亿美元，净亏损率36%，调整后运营利润率从去年同期的17%骤降至1%。公司第二季度营收指引24.5亿—26亿美元不及市场预期，股价盘后一度暴跌超10%。尽管营收同比增长112%至20.78亿美元，收入积压达994亿美元，但资本支出高达67.86亿美元（同比增长265%），债务规模接近250亿美元，“以芯养债、以债扩算”模式的风险正在显现。

艾为电子战略投资Rokid，布局AI多模态感知芯片

艾为电子于5月7日宣布与AR眼镜厂商Rokid达成战略合作并成为其战略投资股东。双方将联合研发面向下一代空间计算的专用多模态感知芯片，攻克低功耗多模态感知、端侧AI算法加速等关键技术。艾为电子的芯片产品已批量应用于Meta、Rokid、小米等AI眼镜品牌，累计出货超亿颗。此次投资将推动艾为电子从“数模芯片供应商”向“AI多模态感知全栈解决方案提供商”转型。

Anthropic成立AI研究院The Anthropic Institute，聚焦四大研究方向并向全球招募研究员

5月7日，Anthropic宣布成立The Anthropic Institute（简称TAI），重点关注经济扩散、威胁与韧性、实际应用中的AI系统，以及AI驱动的研发四大方向。该研究院定位为对外职能机构，旨在系统研究AI对就业、经济结构、国家安全及人机协作模式的深远影响，研究成果将面向政府、机构和公众开放。TAI由Anthropic联合创始人Jack Clark领导，目前已面向全球发布“英雄帖”招募研究员。