Vol.08 老吴AI早高峰 | 手机厂商造了个AI刺客,硅谷顶流工具被扒用中国模型,圈最大金主悄悄撤了
(文章音频版本,可结合正文放心食用,也可前往小宇宙平台搜索:老吴AI早高峰)
前几天老吴刷手机,刷到一个视频,是个深圳创业者,站在腾讯总部门口排队——不是招聘,是排队请工程师帮他安装一个叫OpenClaw的开源AI工具,那条队伍绕了大半条街。
老吴盯着这个视频看了好几遍,突然感受到了一种久违的东西——
那种”时代在转弯”的质感,跟2022年第一次用ChatGPT的感觉,一模一样。
然后这三天,老吴把全球AI新闻刷了个遍,发现几件事,放在一起看,有一条非常清晰的逻辑线——AI的话语权,正在往你想不到的方向流动。

一、小米造了个”AI刺客”:卧底全球最大AI平台整整一周,消耗一万亿token!
这是这三天最戏剧性的故事,老吴把时间线说清楚。
3月11日,全球最大AI接口聚合平台OpenRouter上,悄悄冒出一个叫**Hunter Alpha(猎人阿尔法)**的匿名模型。没有署名,没有公告,什么都没有。
这个模型一上线就连续多天霸占OpenRouter日使用量排行榜第一,一周内处理的token总量超过了整整一万亿。开发者圈全部炸了——这是DeepSeek在测下一代?是哪个神秘机构的内部项目?

3月18日,谜底揭开——造手机的小米,宣布猎人阿尔法就是它们的MiMo-V2-Pro。
这个模型什么量级?1万亿参数,1M超长上下文,专门为Agent工作流深度优化。独立评测机构Artificial Analysis打出接近Claude Opus 4.6的性能分,而价格是它的1/25。同期还推出了MiMo-V2-Omni,支持超过10小时的连续音频处理,原生多模态,文字图片视频音频全吃。
这件事真正震到老吴的,不是模型能力有多强——是它的上线逻辑。不做发布会,不做预热,直接把模型扔进全球最大平台,用一万亿token的真实使用量替自己说话,然后再揭开身份。
一万亿token是市场用真实行动投的票,比任何PPT上的benchmark截图都有力量。
从今以后,你还用发布会来判断一个AI模型好不好,就有点落伍了。

二、Cursor被扒用中国模型:硅谷最火编程工具,底层居然是Kimi K2.5!
3月19日,美国最热门AI编程工具Cursor发布了Composer 2,号称顶级编程性能,所有基准测试大幅提升,价格降了整整86%。开发者一片欢呼。
然后3月22到23日,有人扒出来了——Composer 2的底层,是中国AI公司Moonshot AI的开源模型Kimi K2.5微调版。Cursor的VP公开承认了,说约四分之一的算力来自原始Kimi K2.5,他们加了编程方向的专项强化学习。
VentureBeat的报道标题直接写:”这件事暴露了西方开源AI更深层的问题。”
在当下地缘政治气候里,这个组合在美国科技圈搅起来的风浪,远不只是技术层面的。

但老吴的判断很直接:底层是哪国的模型不重要,出来的东西能用是真的。这件事真正的意义,是它再一次证明——中国开源模型的性价比,已经强到美国顶级产品公司无法绕开了。
数据上,Composer 2确实给力:CursorBench从44.2分升到61.3分,价格从$3.5/$17.5降到$0.5/$2.5,降幅86%。想做活动AI工具开发的团队,这波技术成本降幅值得重新估算项目可行性。

三、黄仁勋宣布撤出OpenAI和Anthropic投资,AI圈最大金主转身了!
英伟达CEO黄仁勋宣布:英伟达对OpenAI的300亿美元投资,以及对Anthropic的100亿美元投资,很可能是最后一次了。官方给的理由是两家公司要IPO,私募窗口关闭。这个解释说不通。越临近IPO通常越往里押,不是撤。

老吴看到的真实逻辑是三层:
第一层:OpenAI签了五角大楼,Anthropic公开拒绝军事用途,两家往相反方向跑,英伟达同时持有两边股份,政治上越来越难站。
第二层:英伟达在GTC发布了自己的企业级AI Agent平台NemoClaw(OpenClaw的企业安全版),黄仁勋说”OpenClaw之于Agent时代,就像Linux之于互联网时代”。英伟达自己要做AI应用层的生意了,继续投直接竞争对手,逻辑上说不通。
第三层,也是最深的:英伟达根本不需要靠股权绑定客户。OpenAI和Anthropic要运转,每年就得从英伟达买几百亿美元的GPU——这个关系比任何股权结构都更牢固。控制水电煤,比持有股权更有力量。
老吴的判断:英伟达完成了从AI生态投资人向AI基础设施垄断者的转型。这个转型,比”撤出投资”这个新闻本身,重要一百倍。

四、OpenClaw彻底爬进了手机,AI不再是开发者的游戏!
3月24日,TECNO发布了EllaClaw Beta——全球第一个把OpenClaw跑在消费级手机上的产品,集成进TECNO的Ella AI助手,面向印度等新兴市场。
AI Agent框架从工程师在电脑上折腾,到品牌把它装进手机交给普通用户——这一步,是”极客玩具”变”大众工具”的临界点信号。就像老吴开场说的那条深圳腾讯门口排队的长龙,Agent这件事,真的已经不再只是开发者的游戏了。

五、这三天最值得看的论文:音视频,天生就是同步的!
3月23日,daVinci-MagiHuman开源上线,当天Hugging Face趋势榜引爆。
来自上海交大GAIR-NLP联合实验室和Sand.ai,15B参数,Apache 2.0协议可商用,支持普通话、粤语、英语、日语、韩语、德语、法语。
它解决的是AI视频生成里的老大难:音视频对不上。传统方法先生成视频再配音,两个系统各干各的,嘴形和声音天然错位,甲方一看就不敢用。

daVinci-MagiHuman用单流Transformer架构,把文字、视频、音频统一放进同一个处理通道,一次建模同步输出——视频帧和声音,在同一个”思考过程”里同时诞生,天生就是配好的。
大白话就是:以前先拍片再找人配音;现在演员、声音、画面,在同一时间线上一起冒出来。
性能:单张H100,5秒256p视频,2秒出结果,比同类开源LTX-2.3快40%。
对活动行业:活动开场视频、发布会倒计时、导演片的AI生成,正式进入可落地阶段了。 客户说嘴形不对?这个问题被解掉了。而且开源可部署,成本接近零。它在改变的,是谁有资格做活动视频内容这件事本身。

最后,老吴的一个预测
把这几件事放在一起看——大模型正在白菜化,MiMo-V2-Pro用Claude Opus 1/25的价格做出接近的性能,Cursor用中国开源模型降价86%,这个趋势不可逆。
但利润还在,它在往两个地方流:Agent基础设施层,和行业Agent工具层。每个行业都有自己的SOP、自己的甲方逻辑、自己的供应商评估体系,这些东西变成专属的Agent工具,比任何通用AI都更有定价权,更不容易被替代。现在还有时间,想想你手里那些最高频的重复性工作,有没有可能先一步Agent化。
夜雨聆风