【AI资讯】告别＂独家绑定＂!微软OpenAI分道扬镳,意味着什么?

🤖 AI 资讯日报

每日精选 · 投融资 · 政策 · 技术 · 产品 · 大厂 · 活动 · 大佬言论 · GitHub · Paper

2026年5月12日 · 星期二

💰

投融资

阶跃星辰完成近25亿美元融资，腾讯连续跟投、加速赴港IPO

阶跃星辰即将完成25亿美元巨额融资，已拆红筹架构加速赴港IPO。老股东腾讯连续跟投，双方4月已签署战略合作，将围绕智能座舱Agent助手展开深度共创，结合大模型与腾讯生态，打造免唤醒、能连续对话、可识别情绪的车载智能助手。华勤、龙旗、豪威、中兴等产业链企业集体参投。

🔗 来源：IT之家

月之暗面（Kimi）完成20亿美元融资，估值突破200亿美元

Kimi本轮融资已到收尾阶段，总金额约20亿美元，早期投资人获得巨额回报。Kimi K2.6此前在编程挑战中击败GPT-5.5和Claude，技术实力得到验证，国产AGI双雄格局（Kimi + DeepSeek）持续加固。

🔗 来源：IT之家

估值 200 亿美元！可灵AI被曝剥离快手单独融资，或成全球最高估值视频大模型

近期有消息称，快手正考虑将其自主研发的视频生成大模型“可灵AI”进行拆分，并计划独立开启Pre-IPO融资。据悉，此次融资的目标估值高达 200 亿美元，并预计在明年正式启动上市程序。

截至 5 月 11 日港股收盘，母公司快手科技的总市值约为 288 亿美元。这意味着，仅可灵AI这一单一业务板块的估值就已接近母公司整体市值的70%。若该笔交易最终达成，可灵AI将超越目前全球范围内所有顶级视频生成产品，跃升为全球估值最高的视频生成模型。

🔗 来源：IT之家

鹿明机器人完成数亿元A1及A2轮融资，三菱电机领投

两轮融资完成后鹿明机器人累计融资近10亿元，资金将用于具身大模型研发和场景拓展持续投入。产业资本三菱电机领投，与公司专注工业与物流落地方向高度相关。具身智能赛道持续获资本追捧。

🔗 来源：新浪财经

📜

政策与监管

谷歌与苹果罕见协同：跨平台RCS消息默认启用端到端加密

2026年5月12日，谷歌与苹果联合宣布，为跨平台RCS消息默认开启端到端加密，基于GSMA RCS Universal Profile 2.5标准扩展，实现安卓与iPhone用户间原生加密通信，无需手动开启。麦肯锡报告显示，跨平台短信诈骗案件85%源于未加密传输，预计加密开启后相关案件可减少62%。

🔗 来源：钛媒体

谷歌警告：攻击者正用AI找漏洞，零日利用已出现真实案例

谷歌威胁情报团队首次确认一起由AI参与开发的零日漏洞利用事件。攻击针对开源Web管理工具，旨在绕过双因素认证，利用代码中发现大量教学性注释和AI生成的CVSS评分，风格符合AI生成特征。此类高层语义与业务逻辑漏洞正是AI擅长发现的类型，AI显著降低攻击技术门槛。

🔗 来源：IT之家

🔬

技术动态

Mozilla：Claude Mythos发现Firefox 271个漏洞，"几乎零误报"

Claude Mythos Preview两个月发现271个安全漏洞，Mozilla表示"零日漏洞的日子屈指可数"。关键突破来自模型能力进步与定制harness系统的结合，AI安全测试能力再获验证。

🔗 来源：Ars Technica

上海AI实验室攻克芯片核心材料：光刻胶树脂稳定制备难题

依托2030新一代人工智能国家科技重大专项，上海AI实验室联合厦门大学、苏州国家实验室，基于"书生"科学大模型与"书生"科学发现平台，构建"AI决策+自动化合成"闭环研发体系，实现高纯度、高一致性、高效率的KrF光刻胶树脂创制。该突破使高端光刻胶树脂稳定制备不再依赖极少数国外供应商"黑箱能力"。

🔗 来源：上海人工智能实验室

智元机器人扮成李小龙表演飞踢：远征A3具身智能震撼亮相

智元机器人在香港具身智能产业峰会上展示远征A3双足机器人，扮成李小龙表演飞踢、高抬腿和蝴蝶步等高难度动作。采用新一代自研关节，峰值电流150A，瞬时功率12kW，机身重量55公斤，综合推重比0.218 kW/kg。支持空翻、空中漫步，标称续航10小时，支持10秒快速换电。

🔗 来源：IT之家

📦

产品发布

告别终端分屏焦虑，Claude Code 推出 Agent View 统管后台 AI 任务

Anthropic 旗下的命令行编程工具 Claude Code 今日正式上线“Agent View”功能，旨在解决开发者在处理多并行 AI 编程任务时面临的窗口管理与上下文切换难题。作为一种“研究预览”状态的全新交互界面，Agent View 允许开发者通过单一视图集中管控所有运行中的 AI 编程会话，显著提升了大规模并发任务的调度效率。

🔗 来源：AIbase

蚂蚁百灵发布Ring-2.6-1T思考模型：可调节推理强度

专为Agent、工程开发及复杂企业工作流设计，创新引入可调节"Reasoning Effort"机制，支持在high与xhigh两种推理强度间灵活切换。high模式面向高频Agent工作流，强调低Token开销与快速多步执行；xhigh模式针对数学、科研等高难逻辑任务提供深度推理空间。

🔗 来源：艾媒网

苹果连发3项AI研究，推进空间计算与Vision Pro方向

苹果近期发布三项AI研究直接回应搁置Vision Pro研发传闻：提出SFI-Bench基准测试空间功能智能；利用AI自动生成美国手语标注，将人工成本降低数百小时；提出HeadsUp方法基于超万人数据集进行高质量3D头部重建。这些进展印证苹果对空间计算方向的持续投入。

🔗 来源：IT之家

🏢

大厂动态

微软与OpenAI正式"松绑"：结束七年独家合作，OpenAI可向所有云厂商开放

微软与OpenAI联合宣布修订合作协议，从2019年开始的"深度绑定"关系进入新阶段。微软对OpenAI的IP许可转为非独家，OpenAI可向所有云厂商开放产品，AGI触发条款正式废除。微软降低对OpenAI技术依赖，OpenAI组建独立销售团队。

双方的关系从深度绑定调整为主要合作伙伴，一定程度上，协议修订对双方来说都是一种“松绑”。

🔗 来源：CSDN

Anthropic获SpaceX Colossus 1全部算力：22万GPU+300MW容量

Anthropic与SpaceX达成合作，获得Colossus 1超级计算机全部算力资源，新增超300MW容量，对应逾22万张NVIDIA GPU，本月内完成接入。即日起Claude产品使用限制全面上调，Claude Mythos Preview已能发现271个Firefox漏洞。

🔗 来源：AI News

阿里千问与淘宝全面打通：业内首次AI购物全链路闭环

用户打开千问App与AI对话即可完成淘宝商品挑选、对比及下单购买；打开淘宝App，点击"千问AI购物助手"，即可使用AI试穿、AI算优惠、AI低价帮抢等功能。阿里率先在行业内打通AI购物从商品推荐到下单、履约、售后的全流程闭环。

🔗 来源：企鹅号

国内首家AI应用商店在沪开业：2000平方米，500余款AI产品

国内首家AI应用商店在上海张江人工智能创新小镇正式开业，总建筑面积超2000平方米，集中呈现全球80余类、500余款前沿AI产品，覆盖教育机器人、健康智能助手、智能办公设备、宠物陪伴机器人等场景。运营方介绍，以往需六个月完成从研发到上市的产品周期，如今有望压缩至二至三个月。

🔗 来源：中关村在线

🎯

活动与行业

纳指剑指30000点！Wedbush：芯片缺口10倍，AI牛市才刚开始

Wedbush分析师Dan Ives预测，随着科技公司财报优于预期提振AI板块信心，未来一年纳斯达克综合指数将挑战30000点大关。他强调，当前芯片供需缺口高达10倍，AI革命仍处早期阶段，看好这波牛市将延续两年，建议投资人布局AI全产业链。

🔗 来源：今日头条

智元董事长邓泰华：具身智能有望成为未来最大单品工业品

邓泰华指出，具身智能产业潜力巨大，未来可能成为规模最大的单品工业品，市场规模可达"单车价格×手机数量"，长远甚至可能超过手机数量。智元已实现规模量产，3月底累计下线1万台机器人，2026年目标为数万台，并在香港落地首批7大部署态解决方案。

🔗 来源：IT之家

微软与OpenAI分道：投行预测微软瞄准920亿美元回报，OpenAI运营成本500亿美元/年

微软自2019年起累计向OpenAI投资约130亿美元，设定920亿美元回报目标（近七倍投资收益），基于OpenAI 2025年底达5000亿美元估值的乐观判断。OpenAI预计2026年在计算资源上的支出将达500亿美元，主要用于GPU硬件、数据中心能耗及基础设施维护，高烧钱速度可能延缓利润分配进程。

🔗 来源：钛媒体

🗣️

大佬言论

菲尔兹奖得主Timothy Gowers：AI数学能力令人震惊，冠名定理时代或将落幕

"钻研数学问题仍然非常有价值，但那种可以享受自己名字永远与某个定理或定义绑定的快感的时代，很可能即将结束。"5月8日，他在几乎不提供专业数学提示与思路引导的前提下，仅用约一小时，就让ChatGPT 5.5 Pro完成了具备博士研究水准的数学原创成果，模型逐步将指数阶结果改进为多项式阶结果。

🔗 来源：新浪AI热点小时报

黄仁勋定义AI工厂：算力即主权，AI正在重构全球产业底层逻辑

5月5日，英伟达CEO黄仁勋在CNBC专访中明确提出AI工厂（AI Factory）概念，指出算力基础设施将成为衡量国家与企业竞争力的核心指标，AI不再是辅助工具，而是像电力、互联网一样的基础设施，垂直整合趋势加剧，芯片→模型→应用的全栈竞争成为新护城河。

🔗 来源：稀土掘金

姚顺宇（AI研究员）：AI英雄主义时代已结束，工程执行力才是核心

在播客访谈中姚顺宇指出，行业核心竞争力已从天才洞察转向工程执行力。在技术路线确立的当下，靠谱、细心和负责任的态度比个人天赋更稀缺。他认为AI个人英雄主义时代已结束，前沿模型开发是数百人协作、依赖海量算力的系统工程。

🔗 来源：X @hongming731

🔥

GitHub 热门项目

DeepSeek-TUI ⭐ 21,461 (+2,434/天)

终端DeepSeek编程Agent，使用Rust编写，在终端中即可体验强大的AI编程辅助能力。

🔗 GitHub

Agent Skills ⭐ 34,618 (+450+/天)

AI编码代理技能库，面向生产环境的工程技能库正获得开发者广泛关注。

🔗 GitHub

anthropics/financial-services ⭐ 14,182

Anthropic官方金融服务业Claude Agent工具库，提供10个即用型模板，覆盖pitchbook生成、KYC审核、月末结账等核心金融场景。

🔗 GitHub

bytedance/UI-TARS-desktop ⭐ 13,000+

字节跳动开源多模态AI Agent技术栈，支持桌面环境的视觉理解和任务自动化。

🔗 GitHub

📄

每日 Paper 精选

🧠 Thinking Machines发布原生多模态"交互模型"：实时人机协作新范式

📎 https://thinkingmachines.ai/blog/interaction-models

✨ 前OpenAI CTO Mira创立的Thinking Machines，发布实时多模态交互模型，能原生接收音频/视频/文本并实时响应

🔬 核心创新

• 前台交互模型：以200毫秒为节点处理输入，维持用户"在场感"，支持随时打断，实现真正的实时对话体验

• 后台推理模型：处理长程规划、工具调用等复杂任务，与前台模型协同工作

• 统一界面：不同于Agent串联多个独立模型，呈现为一个既能实时交互又能处理重度任务的统一系统

• 多模态原生融合：不再通过模块拼接，而是让音频、视频、文本在模型层原生融合

🌈 通俗解读

之前的"AI Agent"像是多个接线员串在一起——视觉一个、语音一个、逻辑一个，协作靠调度器。这次的"交互模型"更像是长出一个完整的大脑：所有感知同时输入、同时思考、同时输出。200毫秒的响应节点意味着AI能像人一样保持"对话感"——对方还在说的时候，AI已经理解并组织回应了。

❓ 为什么值得关注

这是下一代AI交互的雏形。随着模型能力的提升，人机交互正在从"问答式"向"协作式"转变。这种实时多模态原生架构，可能代表了未来AI助手的标准形态。做AI产品的从业者，必须关注。

👆 觉得有用？点赞 + 在看 支持一下 👆

每天陪你追踪 AI 最前沿 🚀

想看更多精彩内容？

扫描下方二维码加入群聊

@本文为AI洞察局原创内容

未经授权, 禁止转载

进群、转载或商务合作联系后台

— 完 —