Vol.08 老吴AI早高峰 | 手机厂商造了个AI刺客,硅谷顶流工具被扒用中国模型,圈最大金主悄悄撤了

（文章音频版本，可结合正文放心食用，也可前往小宇宙平台搜索：老吴AI早高峰）

前几天老吴刷手机，刷到一个视频，是个深圳创业者，站在腾讯总部门口排队——不是招聘，是排队请工程师帮他安装一个叫OpenClaw的开源AI工具，那条队伍绕了大半条街。

老吴盯着这个视频看了好几遍，突然感受到了一种久违的东西——

那种”时代在转弯”的质感，跟2022年第一次用ChatGPT的感觉，一模一样。

然后这三天，老吴把全球AI新闻刷了个遍，发现几件事，放在一起看，有一条非常清晰的逻辑线——AI的话语权，正在往你想不到的方向流动。

一、小米造了个”AI刺客”：卧底全球最大AI平台整整一周，消耗一万亿token！

这是这三天最戏剧性的故事，老吴把时间线说清楚。

3月11日，全球最大AI接口聚合平台OpenRouter上，悄悄冒出一个叫**Hunter Alpha（猎人阿尔法）**的匿名模型。没有署名，没有公告，什么都没有。

这个模型一上线就连续多天霸占OpenRouter日使用量排行榜第一，一周内处理的token总量超过了整整一万亿。开发者圈全部炸了——这是DeepSeek在测下一代？是哪个神秘机构的内部项目？

3月18日，谜底揭开——造手机的小米，宣布猎人阿尔法就是它们的MiMo-V2-Pro。

这个模型什么量级？1万亿参数，1M超长上下文，专门为Agent工作流深度优化。独立评测机构Artificial Analysis打出接近Claude Opus 4.6的性能分，而价格是它的1/25。同期还推出了MiMo-V2-Omni，支持超过10小时的连续音频处理，原生多模态，文字图片视频音频全吃。

这件事真正震到老吴的，不是模型能力有多强——是它的上线逻辑。不做发布会，不做预热，直接把模型扔进全球最大平台，用一万亿token的真实使用量替自己说话，然后再揭开身份。

一万亿token是市场用真实行动投的票，比任何PPT上的benchmark截图都有力量。

从今以后，你还用发布会来判断一个AI模型好不好，就有点落伍了。

二、Cursor被扒用中国模型：硅谷最火编程工具，底层居然是Kimi K2.5！

3月19日，美国最热门AI编程工具Cursor发布了Composer 2，号称顶级编程性能，所有基准测试大幅提升，价格降了整整86%。开发者一片欢呼。

然后3月22到23日，有人扒出来了——Composer 2的底层，是中国AI公司Moonshot AI的开源模型Kimi K2.5微调版。Cursor的VP公开承认了，说约四分之一的算力来自原始Kimi K2.5，他们加了编程方向的专项强化学习。

VentureBeat的报道标题直接写：”这件事暴露了西方开源AI更深层的问题。”

在当下地缘政治气候里，这个组合在美国科技圈搅起来的风浪，远不只是技术层面的。

但老吴的判断很直接：底层是哪国的模型不重要，出来的东西能用是真的。这件事真正的意义，是它再一次证明——中国开源模型的性价比，已经强到美国顶级产品公司无法绕开了。

数据上，Composer 2确实给力：CursorBench从44.2分升到61.3分，价格从$3.5/$17.5降到$0.5/$2.5，降幅86%。想做活动AI工具开发的团队，这波技术成本降幅值得重新估算项目可行性。

三、黄仁勋宣布撤出OpenAI和Anthropic投资，AI圈最大金主转身了！

英伟达CEO黄仁勋宣布：英伟达对OpenAI的300亿美元投资，以及对Anthropic的100亿美元投资，很可能是最后一次了。官方给的理由是两家公司要IPO，私募窗口关闭。这个解释说不通。越临近IPO通常越往里押，不是撤。

老吴看到的真实逻辑是三层：

第一层：OpenAI签了五角大楼，Anthropic公开拒绝军事用途，两家往相反方向跑，英伟达同时持有两边股份，政治上越来越难站。

第二层：英伟达在GTC发布了自己的企业级AI Agent平台NemoClaw（OpenClaw的企业安全版），黄仁勋说”OpenClaw之于Agent时代，就像Linux之于互联网时代”。英伟达自己要做AI应用层的生意了，继续投直接竞争对手，逻辑上说不通。

第三层，也是最深的：英伟达根本不需要靠股权绑定客户。OpenAI和Anthropic要运转，每年就得从英伟达买几百亿美元的GPU——这个关系比任何股权结构都更牢固。控制水电煤，比持有股权更有力量。

老吴的判断：英伟达完成了从AI生态投资人向AI基础设施垄断者的转型。这个转型，比”撤出投资”这个新闻本身，重要一百倍。

四、OpenClaw彻底爬进了手机，AI不再是开发者的游戏！

3月24日，TECNO发布了EllaClaw Beta——全球第一个把OpenClaw跑在消费级手机上的产品，集成进TECNO的Ella AI助手，面向印度等新兴市场。

AI Agent框架从工程师在电脑上折腾，到品牌把它装进手机交给普通用户——这一步，是”极客玩具”变”大众工具”的临界点信号。就像老吴开场说的那条深圳腾讯门口排队的长龙，Agent这件事，真的已经不再只是开发者的游戏了。

五、这三天最值得看的论文：音视频，天生就是同步的！

3月23日，daVinci-MagiHuman开源上线，当天Hugging Face趋势榜引爆。

来自上海交大GAIR-NLP联合实验室和Sand.ai，15B参数，Apache 2.0协议可商用，支持普通话、粤语、英语、日语、韩语、德语、法语。

它解决的是AI视频生成里的老大难：音视频对不上。传统方法先生成视频再配音，两个系统各干各的，嘴形和声音天然错位，甲方一看就不敢用。

daVinci-MagiHuman用单流Transformer架构，把文字、视频、音频统一放进同一个处理通道，一次建模同步输出——视频帧和声音，在同一个”思考过程”里同时诞生，天生就是配好的。

大白话就是：以前先拍片再找人配音；现在演员、声音、画面，在同一时间线上一起冒出来。

性能：单张H100，5秒256p视频，2秒出结果，比同类开源LTX-2.3快40%。

对活动行业：活动开场视频、发布会倒计时、导演片的AI生成，正式进入可落地阶段了。 客户说嘴形不对？这个问题被解掉了。而且开源可部署，成本接近零。它在改变的，是谁有资格做活动视频内容这件事本身。

最后，老吴的一个预测

把这几件事放在一起看——大模型正在白菜化，MiMo-V2-Pro用Claude Opus 1/25的价格做出接近的性能，Cursor用中国开源模型降价86%，这个趋势不可逆。

但利润还在，它在往两个地方流：Agent基础设施层，和行业Agent工具层。每个行业都有自己的SOP、自己的甲方逻辑、自己的供应商评估体系，这些东西变成专属的Agent工具，比任何通用AI都更有定价权，更不容易被替代。现在还有时间，想想你手里那些最高频的重复性工作，有没有可能先一步Agent化。