
今天有好几件事叠在一起,很难说哪件"最重要",但我想先说一个可能被低估的:翁荔(Ling Wang)今天拿出了她出走OpenAI之后的第一个模型。
翁荔是谁?她是OpenAI联合创始人之一,在OpenAI时主要负责对齐、安全和研究工程,和穆拉蒂、奥特曼并列是那家公司技术层面最有话语权的三个人之一。去年秋天她悄悄离职,和穆拉蒂的Thinking Machines Lab(TML)搭上了,现在TML发布了第一个东西——一个叫TML-Interaction-Small的模型,做的事情很具体:原生实时交互。
不是追加了一个语音插件,不是加了个流式输出。它的意思是:整个模型从底层就是为了"持续对话"设计的,可以同时接收音频、视频和文本,在你讲话的时候它在听、在思考、同时还在搜索或者生成UI,不需要等你说完。延迟比GPT-realtime-2.0快4倍,这个数字是有实测基准的。
这件事本身值得专门说,因为它触到了现在大模型体验的一根刺——绝大多数AI对话产品,本质上还是回合制的。你说,它才说,它说的时候你等着。TML-Interaction-Small想做的是把这个"一问一答"的底层范式拆掉,换成更接近人和人之间对话的东西。
当然现在还是"研究预览版",没有公众开放。但TML现在估值已经被传到了3400亿人民币这个级别,作为一家成立不到一年、头一次发模型的公司,这个数字本身就说明资本对这条技术路线押了多大的注。
OpenAI换了个活法
与此同时,OpenAI今天做了一件在表面上看不太性感,但其实相当有战略意义的事——成立了一个叫"OpenAI部署公司(OpenAI Deployment Company)"的子公司,扔进去40亿美元,方向是帮企业把AI嵌入真正的业务流程里。
这件事值得仔细想一下。
过去几年OpenAI的产品逻辑是:我们做最好的模型,卖API给你,你自己搭应用。这条路走到今天遇到了一个问题:用API的开发者越来越多,但真正把AI用进核心业务、产生可量化回报的企业,比例还是偏低。有调查数字:全球95%的企业AI投资回报率为零或接近零。
原因不是模型不够好,而是大多数企业自己搞不定从"模型能力"到"业务落地"的那段距离。OpenAI部署公司要做的就是这段距离——派所谓的FDE(Forward Deployed Engineers,前沿部署工程师)直接进驻企业,帮你重新设计销售流程、供应链流程、财务核算流程,用AI改造完之后还会帮你维护系统更新。
随着这家新公司,OpenAI还一起发布了一个网络安全工具叫Daybreak。逻辑很直接:AI越嵌入企业核心系统,安全漏洞的威胁就越大,得配套解决这个问题。Daybreak的定位是"网络防御者的AI工具",功能包括自动发现代码漏洞、安全代码审查、威胁建模、补丁验证——实质上是想在AI大规模嵌入企业基础设施之前,先把安全层做好。
参与这家公司的合作方已经有19家,包括之前被收购的英国AI咨询公司Tomoro,后者的约150名工程师会转入部署公司。
如果从竞争角度来理解这个动作:Anthropic在企业侧已经做了相当多的布局,麦肯锡、埃森哲也都在抢AI实施服务这块蛋糕。OpenAI成立独立部署公司,是在这场竞争里下了一张底牌——我不只是模型供应商,我也是你的系统集成商。
快手的AI子公司,差点比它老妈还值钱
今天另一件让人停下来的事,是快手。
消息来自《The Information》的报道:快手正在计划把旗下的可灵AI(Kling)分拆出来独立融资,目标估值200亿美元,融资规模约20亿美元,腾讯可能参与,时间表指向2027年第一季度IPO。
数字本身的荒诞感在于:快手现在整体市值约290亿美元,而它正在分拆的这个部门,单独估值已经定到了200亿美元——差不多是母公司的七成。
这不是什么奇怪的算法,背后有相当具体的财务逻辑。可灵AI现在的年化收入大约在5亿美元左右,主要来自北美付费用户,月活超过1200万,App付费用户今年环比涨了350%。在视频生成这个赛道里,这个数据放到任何一个可比公司里都是头部水平。
问题是,如果可灵留在快手报表里,它会被快手主业的低估值率拖着一起压低。快手现在的市销率(PS ratio)大概在1.5倍,这是短视频广告+直播电商生意该有的估值。但放在AI视频生成这条赛道上,竞争对手的PS可以到30倍甚至50倍——同样是5亿美元年化收入,在两个估值体系里的价格差了20倍以上。
快手的选择是把可灵从母公司定价逻辑里剥离出来,让它以纯AI公司的身份去面对资本市场。消息一出,快手港股当天高开近10%。
当然风险也是真实的。可灵现在面对的竞争不是三年前那个环境了。字节Seedance 2.0已经出来了,阿里HappyHorse(快乐马)在多项基准测试上超过了可灵3.0——而且HappyHorse的技术负责人张迪,原来是快手可灵的核心团队成员。人都走了,技术护城河需要重新评估。
但如果不分拆,可灵只能永远躺在快手财报里被低估。从这个角度看,这是一次不得不做的"估值解锁"手术。
390万,现实版高达
话题跳一下,宇树科技今天也发了个东西,和AI关系不大,但很难不看。
全球首款量产版载人变形机甲,型号GD01,售价390万元起。宇树科技创始人王兴兴亲自乘进去演示,整个视频没有加速处理。机甲载人后总重约500公斤,可以在双足模式(直立行走,适合城市街道)和四足模式(爬坡、楼梯、越野地形)之间切换,双足状态下大约是成年人身高的1.6倍。
这不是原型机,不是渲染图,不是"预计2027年量产"——宇树说这是量产版,390万起的定价是真实的定价。
宇树原来是做机器狗起家的,后来出了人形机器人,跑马拉松,上春晚,打擂台。现在这台GD01是在另一个方向走:载人机甲,用途按官方说法是"民用交通工具",但实际应用场景还很模糊,一个城市用户也说不清楚自己要花390万买这个干什么。
但这不重要。宇树每次出新品,不是在告诉你一个清晰的需求,而是在告诉你一条技术路线走到了哪里。从机器狗到人形机器人到载人机甲,这条路线一直在往"人和机器合体"这个方向推进。用不了多少年,今天看起来稀奇的东西可能就会变成普通的。
谷歌的视频模型,提前露了脸
最后说谷歌。
5月12日,多个用户在Gemini移动App里发现了一个新的模型入口,名字叫"Gemini Omni",描述写的是"全新视频生成模型,支持混剪和直接在对话里编辑"。
按照目前掌握的情报,Gemini Omni支持生成10秒的1280×720视频,会被深度集成进Gemini应用,具备比Veo更强的提示理解和推理能力。按谷歌的日程,这个模型大概率会在5月19日的谷歌I/O大会上正式发布。
Gemini Omni出来的时机很微妙。可灵刚宣布分拆准备上市,阿里HappyHorse还在持续迭代,视频生成这条赛道在过去一年里已经从"技术demo"阶段走到了"付费用户规模竞争"阶段。谷歌带着Gemini Omni下场,代表这个赛道的竞争格局要再变一次。
谷歌的优势在于流量入口——Gemini有多少用户,Omni就可以直接触达多少人,不需要从零开始拉新。但视频生成是一个对推理算力消耗极大的业务,谷歌能否在成本上控制住,会是个持续的考验。
今天这五件事,表面上很散,但有一条线可以穿起来:AI在往用户面前走。
OpenAI不再只是在服务器上算模型了,它要进到企业的具体业务里去。翁荔要把对话这件事做成不需要等的实时体验。快手要把可灵推到离用户估值逻辑更近的地方。宇树要让人骑进机器里去。谷歌要把视频生成塞进每天打开的App里。
这不一定是好事,但它是在发生的事。
下周谷歌I/O,Gemini Omni、可能还有更多东西会在5月19日那天出来,到时候再聊。
如果这篇文章对你有用,欢迎转发给有需要的人。
OpenAI手机提前了一年,美国政府把五大AI实验室全管住了
夜雨聆风