🎙️ OpenAI发布三款实时语音模型,开启“思考型”语音交互时代
OpenAI于5月12日凌晨正式发布三款新一代实时语音模型,旨在彻底改变人机语音交互模式。其中,GPT-Realtime-2是全球首个具备GPT-5级别推理能力的音频模型,能够像人类一样在对话中进行实时思考与复杂逻辑处理,终结了传统语音助手“听清但听不懂”的智障时代。伴随发布的还有GPT-Realtime-Translate和GPT-Realtime-Whisper,分别专注于实时翻译与流式转写。翻译模型支持70多种输入语言到13种输出语言的实时互译,按分钟计费(0.034美元/分钟);转写模型价格为0.017美元/分钟。这一组合标志着语音正从简单的指令接收渠道,进化为集聆听、思考、翻译、记录于一体的全能智能入口。
🔬 世界数字教育大会发布6项科学智能成果,展示AI赋能科研“中国方案”
在5月12日于杭州举办的2026世界数字教育大会平行会议上,6项具有国际领先水平的科学智能大模型和智能体集中发布。其中,生成式基因组大模型Carbon由北京中关村学院与HuggingFace联合开发,定位为生命科学领域的“DeepSeek”,其计算效率提升近百倍,可广泛应用于DNA序列设计、mRNA疫苗优化等合成生物学与精准医学方向。面向自驱动实验室的智能体基础设施则致力于实现科研实验的自动化与自主化。此外,旨在精准感知物理环境的无线世界高精度多模态实测数据集和跨城市AI4Net基础模型,为未来6G智能网络的关键技术“无线世界模型”奠定了基础。
💰 韩国政策高层提议建立“公民红利”,将AI超额利润回馈全民
韩国总统府政策室长金容范于5月12日提出,有必要考虑建立“公民红利”制度,以此将人工智能基础设施时代产生的超额利润回馈给全体公民。他认为,韩国凭借在AI芯片、电网和数据中心等供应链中的战略地位,可能已进入基于“结构性稀缺性和持续超额利润”的技术垄断经济阶段,这种繁荣并非周期性,而是结构性的。因此,需要建立新的社会契约,确保AI带来的巨大收益能够惠及整个社会,而非仅局限于特定企业或资产持有阶层。此提议一度引发韩国KOSPI指数盘中跌超5%,SK海力士、三星电子等科技股短线跳水。
🤖 香港着力推动具身智能产业,成立AI研发院促成果转化
香港特区行政长官李家超在5月12日出席首届香港具身智能产业峰会时宣布,香港将积极对接国家“人工智能+”行动,着力推动具身智能等策略性未来产业发展。具体举措包括:由特区政府设立的InnoHK创新香港研发平台已资助16家聚焦AI与机器人的实验室;数码港正在支援约120家涉及人形机器人、无人驾驶等领域的企业。为进一步推动AI赋能产业,特区政府将成立“AI+与产业发展策略委员会”,并计划于下半年投入运营全资拥有的香港人工智能研发院,旨在搭建AI技术方案配对平台,加速包括具身智能在内的解决方案的商品化和产业赋能。
🏭 微软推出行业专属AI大模型套件,助力制造业故障预警准确率达92%
国际科技巨头微软于5月12日宣布推出行业专属AI大模型套件,针对制造、物流、金融三大领域进行深度算法优化。在制造业场景中,该套件中的模型可实时分析生产设备传感器数据,将设备故障预警的准确率大幅提升至92%。在物流领域,模型通过智能路径规划,能帮助跨国企业降低高达15%的跨境运输成本。目前,该套件已与宝马集团、联邦快递等全球领先企业达成合作,并预计在2026年下半年向中小企业开放轻量化版本,为传统行业的智能化转型提供了可复制的技术路径和降本增效的明确价值。
夜雨聆风