
🤖 AI 资讯日报
每日精选 · 投融资 · 政策 · 技术 · 产品 · 大厂 · 活动 · 大佬言论 · GitHub · Paper
2026年5月12日 · 星期二
投融资
阶跃星辰完成近25亿美元融资,腾讯连续跟投、加速赴港IPO
阶跃星辰即将完成25亿美元巨额融资,已拆红筹架构加速赴港IPO。老股东腾讯连续跟投,双方4月已签署战略合作,将围绕智能座舱Agent助手展开深度共创,结合大模型与腾讯生态,打造免唤醒、能连续对话、可识别情绪的车载智能助手。华勤、龙旗、豪威、中兴等产业链企业集体参投。

🔗 来源:IT之家
月之暗面(Kimi)完成20亿美元融资,估值突破200亿美元
Kimi本轮融资已到收尾阶段,总金额约20亿美元,早期投资人获得巨额回报。Kimi K2.6此前在编程挑战中击败GPT-5.5和Claude,技术实力得到验证,国产AGI双雄格局(Kimi + DeepSeek)持续加固。
🔗 来源:IT之家
估值 200 亿美元!可灵AI被曝剥离快手单独融资,或成全球最高估值视频大模型
近期有消息称,快手正考虑将其自主研发的视频生成大模型“可灵AI”进行拆分,并计划独立开启Pre-IPO融资。据悉,此次融资的目标估值高达 200 亿美元,并预计在明年正式启动上市程序。
截至 5 月 11 日港股收盘,母公司快手科技的总市值约为 288 亿美元。这意味着,仅可灵AI这一单一业务板块的估值就已接近母公司整体市值的70%。若该笔交易最终达成,可灵AI将超越目前全球范围内所有顶级视频生成产品,跃升为全球估值最高的视频生成模型。
🔗 来源:IT之家
鹿明机器人完成数亿元A1及A2轮融资,三菱电机领投
两轮融资完成后鹿明机器人累计融资近10亿元,资金将用于具身大模型研发和场景拓展持续投入。产业资本三菱电机领投,与公司专注工业与物流落地方向高度相关。具身智能赛道持续获资本追捧。
🔗 来源:新浪财经
政策与监管
谷歌与苹果罕见协同:跨平台RCS消息默认启用端到端加密
2026年5月12日,谷歌与苹果联合宣布,为跨平台RCS消息默认开启端到端加密,基于GSMA RCS Universal Profile 2.5标准扩展,实现安卓与iPhone用户间原生加密通信,无需手动开启。麦肯锡报告显示,跨平台短信诈骗案件85%源于未加密传输,预计加密开启后相关案件可减少62%。

🔗 来源:钛媒体
谷歌警告:攻击者正用AI找漏洞,零日利用已出现真实案例
谷歌威胁情报团队首次确认一起由AI参与开发的零日漏洞利用事件。攻击针对开源Web管理工具,旨在绕过双因素认证,利用代码中发现大量教学性注释和AI生成的CVSS评分,风格符合AI生成特征。此类高层语义与业务逻辑漏洞正是AI擅长发现的类型,AI显著降低攻击技术门槛。
🔗 来源:IT之家
技术动态
Mozilla:Claude Mythos发现Firefox 271个漏洞,"几乎零误报"
Claude Mythos Preview两个月发现271个安全漏洞,Mozilla表示"零日漏洞的日子屈指可数"。关键突破来自模型能力进步与定制harness系统的结合,AI安全测试能力再获验证。
🔗 来源:Ars Technica
上海AI实验室攻克芯片核心材料:光刻胶树脂稳定制备难题
依托2030新一代人工智能国家科技重大专项,上海AI实验室联合厦门大学、苏州国家实验室,基于"书生"科学大模型与"书生"科学发现平台,构建"AI决策+自动化合成"闭环研发体系,实现高纯度、高一致性、高效率的KrF光刻胶树脂创制。该突破使高端光刻胶树脂稳定制备不再依赖极少数国外供应商"黑箱能力"。

🔗 来源:上海人工智能实验室
智元机器人扮成李小龙表演飞踢:远征A3具身智能震撼亮相
智元机器人在香港具身智能产业峰会上展示远征A3双足机器人,扮成李小龙表演飞踢、高抬腿和蝴蝶步等高难度动作。采用新一代自研关节,峰值电流150A,瞬时功率12kW,机身重量55公斤,综合推重比0.218 kW/kg。支持空翻、空中漫步,标称续航10小时,支持10秒快速换电。
🔗 来源:IT之家
产品发布
告别终端分屏焦虑,Claude Code 推出 Agent View 统管后台 AI 任务
Anthropic 旗下的命令行编程工具 Claude Code 今日正式上线“Agent View”功能,旨在解决开发者在处理多并行 AI 编程任务时面临的窗口管理与上下文切换难题。作为一种“研究预览”状态的全新交互界面,Agent View 允许开发者通过单一视图集中管控所有运行中的 AI 编程会话,显著提升了大规模并发任务的调度效率。

🔗 来源:AIbase
蚂蚁百灵发布Ring-2.6-1T思考模型:可调节推理强度
专为Agent、工程开发及复杂企业工作流设计,创新引入可调节"Reasoning Effort"机制,支持在high与xhigh两种推理强度间灵活切换。high模式面向高频Agent工作流,强调低Token开销与快速多步执行;xhigh模式针对数学、科研等高难逻辑任务提供深度推理空间。
🔗 来源:艾媒网
苹果连发3项AI研究,推进空间计算与Vision Pro方向
苹果近期发布三项AI研究直接回应搁置Vision Pro研发传闻:提出SFI-Bench基准测试空间功能智能;利用AI自动生成美国手语标注,将人工成本降低数百小时;提出HeadsUp方法基于超万人数据集进行高质量3D头部重建。这些进展印证苹果对空间计算方向的持续投入。
🔗 来源:IT之家
大厂动态
微软与OpenAI正式"松绑":结束七年独家合作,OpenAI可向所有云厂商开放
微软与OpenAI联合宣布修订合作协议,从2019年开始的"深度绑定"关系进入新阶段。微软对OpenAI的IP许可转为非独家,OpenAI可向所有云厂商开放产品,AGI触发条款正式废除。微软降低对OpenAI技术依赖,OpenAI组建独立销售团队。
双方的关系从深度绑定调整为主要合作伙伴,一定程度上,协议修订对双方来说都是一种“松绑”。

🔗 来源:CSDN
Anthropic获SpaceX Colossus 1全部算力:22万GPU+300MW容量
Anthropic与SpaceX达成合作,获得Colossus 1超级计算机全部算力资源,新增超300MW容量,对应逾22万张NVIDIA GPU,本月内完成接入。即日起Claude产品使用限制全面上调,Claude Mythos Preview已能发现271个Firefox漏洞。
🔗 来源:AI News
阿里千问与淘宝全面打通:业内首次AI购物全链路闭环
用户打开千问App与AI对话即可完成淘宝商品挑选、对比及下单购买;打开淘宝App,点击"千问AI购物助手",即可使用AI试穿、AI算优惠、AI低价帮抢等功能。阿里率先在行业内打通AI购物从商品推荐到下单、履约、售后的全流程闭环。
🔗 来源:企鹅号
国内首家AI应用商店在沪开业:2000平方米,500余款AI产品
国内首家AI应用商店在上海张江人工智能创新小镇正式开业,总建筑面积超2000平方米,集中呈现全球80余类、500余款前沿AI产品,覆盖教育机器人、健康智能助手、智能办公设备、宠物陪伴机器人等场景。运营方介绍,以往需六个月完成从研发到上市的产品周期,如今有望压缩至二至三个月。

🔗 来源:中关村在线
活动与行业
纳指剑指30000点!Wedbush:芯片缺口10倍,AI牛市才刚开始
Wedbush分析师Dan Ives预测,随着科技公司财报优于预期提振AI板块信心,未来一年纳斯达克综合指数将挑战30000点大关。他强调,当前芯片供需缺口高达10倍,AI革命仍处早期阶段,看好这波牛市将延续两年,建议投资人布局AI全产业链。
🔗 来源:今日头条
智元董事长邓泰华:具身智能有望成为未来最大单品工业品
邓泰华指出,具身智能产业潜力巨大,未来可能成为规模最大的单品工业品,市场规模可达"单车价格×手机数量",长远甚至可能超过手机数量。智元已实现规模量产,3月底累计下线1万台机器人,2026年目标为数万台,并在香港落地首批7大部署态解决方案。

🔗 来源:IT之家
微软与OpenAI分道:投行预测微软瞄准920亿美元回报,OpenAI运营成本500亿美元/年
微软自2019年起累计向OpenAI投资约130亿美元,设定920亿美元回报目标(近七倍投资收益),基于OpenAI 2025年底达5000亿美元估值的乐观判断。OpenAI预计2026年在计算资源上的支出将达500亿美元,主要用于GPU硬件、数据中心能耗及基础设施维护,高烧钱速度可能延缓利润分配进程。
🔗 来源:钛媒体
大佬言论
菲尔兹奖得主Timothy Gowers:AI数学能力令人震惊,冠名定理时代或将落幕
"钻研数学问题仍然非常有价值,但那种可以享受自己名字永远与某个定理或定义绑定的快感的时代,很可能即将结束。"5月8日,他在几乎不提供专业数学提示与思路引导的前提下,仅用约一小时,就让ChatGPT 5.5 Pro完成了具备博士研究水准的数学原创成果,模型逐步将指数阶结果改进为多项式阶结果。
🔗 来源:新浪AI热点小时报
黄仁勋定义AI工厂:算力即主权,AI正在重构全球产业底层逻辑
5月5日,英伟达CEO黄仁勋在CNBC专访中明确提出AI工厂(AI Factory)概念,指出算力基础设施将成为衡量国家与企业竞争力的核心指标,AI不再是辅助工具,而是像电力、互联网一样的基础设施,垂直整合趋势加剧,芯片→模型→应用的全栈竞争成为新护城河。
🔗 来源:稀土掘金
姚顺宇(AI研究员):AI英雄主义时代已结束,工程执行力才是核心
在播客访谈中姚顺宇指出,行业核心竞争力已从天才洞察转向工程执行力。在技术路线确立的当下,靠谱、细心和负责任的态度比个人天赋更稀缺。他认为AI个人英雄主义时代已结束,前沿模型开发是数百人协作、依赖海量算力的系统工程。
🔗 来源:X @hongming731
GitHub 热门项目
DeepSeek-TUI ⭐ 21,461 (+2,434/天)
终端DeepSeek编程Agent,使用Rust编写,在终端中即可体验强大的AI编程辅助能力。
🔗 GitHub
Agent Skills ⭐ 34,618 (+450+/天)
AI编码代理技能库,面向生产环境的工程技能库正获得开发者广泛关注。
🔗 GitHub
anthropics/financial-services ⭐ 14,182
Anthropic官方金融服务业Claude Agent工具库,提供10个即用型模板,覆盖pitchbook生成、KYC审核、月末结账等核心金融场景。
🔗 GitHub
bytedance/UI-TARS-desktop ⭐ 13,000+
字节跳动开源多模态AI Agent技术栈,支持桌面环境的视觉理解和任务自动化。
🔗 GitHub
每日 Paper 精选
🧠 Thinking Machines发布原生多模态"交互模型":实时人机协作新范式
📎 https://thinkingmachines.ai/blog/interaction-models🔬 核心创新
• 前台交互模型:以200毫秒为节点处理输入,维持用户"在场感",支持随时打断,实现真正的实时对话体验
• 后台推理模型:处理长程规划、工具调用等复杂任务,与前台模型协同工作
• 统一界面:不同于Agent串联多个独立模型,呈现为一个既能实时交互又能处理重度任务的统一系统
• 多模态原生融合:不再通过模块拼接,而是让音频、视频、文本在模型层原生融合
🌈 通俗解读
之前的"AI Agent"像是多个接线员串在一起——视觉一个、语音一个、逻辑一个,协作靠调度器。这次的"交互模型"更像是长出一个完整的大脑:所有感知同时输入、同时思考、同时输出。200毫秒的响应节点意味着AI能像人一样保持"对话感"——对方还在说的时候,AI已经理解并组织回应了。
❓ 为什么值得关注
这是下一代AI交互的雏形。随着模型能力的提升,人机交互正在从"问答式"向"协作式"转变。这种实时多模态原生架构,可能代表了未来AI助手的标准形态。做AI产品的从业者,必须关注。
👆 觉得有用?点赞 + 在看 支持一下 👆
每天陪你追踪 AI 最前沿 🚀
想看更多精彩内容?
扫描下方二维码加入群聊

@本文为AI洞察局原创内容
未经授权, 禁止转载
进群、转载或商务合作联系后台
— 完 —


夜雨聆风