乐于分享
好东西不私藏

AI正在重新定义“有用”这件事

AI正在重新定义“有用”这件事

AI正在重新定义“有用”这件事

AI行业终于开始学会做减法了。

这周最让我兴奋的消息不是GPT-5.5发布,不是Anthropic估值冲9000亿,而是一条容易被忽略的技术简讯:阿里Metis agent把冗余工具调用从98%砍到2%,同时准确率还提升了。这意味着什么?意味着AI agent终于开始明白什么时候该闭嘴、什么时候该干活,而不是像个话痨实习生一样遇事就问“要不要查一下这个要不要调一下那个”。

围绕这个信号,这周还有其他几条值得串起来看的动态:苹果照片App要大幅升级、Stripe发布288项新功能、GPT-5.5定价翻倍、企业级AI agent平台激战正酣。它们表面上风马牛不相及,但底下其实在说同一件事——AI技术的产品化和平台化正在进入一个新阶段:谁能让AI真正变得“有用”,而不是“能用”,谁才能活过这轮洗牌。

AI agent终于不乱来了,效率革命从“少做事”开始

先说Metis这个具体数字——从98%的冗余调用降到2%,听起来是技术细节,但它的意义远超技术本身。

这背后其实是AI agent领域长期存在的一个核心悖论:模型能力越强,开发者越倾向于给它堆更多工具、更多能力、更多可能性,结果AI agent变成了一个拿着瑞士军刀却不知道该用哪把刀的工具箱重度用户。每个任务来了,它先把所有工具摸一遍,排除一遍,再选一个执行——效率低到令人发指,用户体验更是不准确。

阿里这个做法本质上是给agent装了一个“判断层”:在调用任何外部工具之前,先让模型自己评估这件事到底需不需要调用外部工具,还是靠内部知识就够。这个逻辑听起来理所当然,但行业内真正做进去的不多。原因很简单——做加法容易,做减法难。堆功能是显成绩,精简调用是暗功夫。

更深一层看,这件事折射出当前AI应用落地的一个关键转折:从“模型能力崇拜”转向“系统效率优化”。过去两年大家都在比模型参数、比上下文窗口长度、比支持多少种模态,现在发现这些指标在真实场景里压根不是瓶颈。真正的瓶颈是:模型很强,但用它的人或者系统依然很蠢。Metis的出现说明阿里在解决这个“强模型+弱系统”的错配问题上拿出了真东西。

对行业来说,这意味着下一代AI agent的竞争焦点会从“模型有多聪明”转移到“系统有多高效”。以后吹牛的方向得改改了——不是“我家模型又破了什么榜”,而是“我家agent完成一个任务只调了两次工具”。

苹果照片App升级背后的平台焦虑

苹果这周被曝出iOS 27要大幅升级照片App。如果只是普通的功能迭代,我不会专门拿出来说,但这件事放在AI平台竞争的大背景下,味道就变了。

苹果做AI的逻辑和OpenAI、Google不一样。后者是AI Native,AI就是产品本身;苹果是AI as Feature,AI必须嵌入到现有的使用场景里才有价值。照片App升级,本质上是在抢占一个高频AI入口——用户每天打开相册的次数远超过打开任何独立AI应用的次数,谁先在相册里把AI修图、AI整理、AI搜索做到好用,谁就占领了用户心智。

但问题是,苹果做这件事有一个天然的短板:端侧模型能力有限,隐私合规又绑手绑脚,想在照片处理上搞大动作,能力边界很清楚。这次升级如果真的有大动作,要么意味着苹果端侧模型有了实质突破,要么意味着苹果终于想通了要和云端模型更深度地合作——不管哪种,对行业格局都有影响。

换个角度说,苹果这种体量的玩家现在开始认真“AI化”自己的核心App,说明什么?说明AI功能已经从“锦上添花”变成了“产品必须”。连苹果这种靠体验溢价吃饭的公司都不得不把AI功能当成下一代产品的核心卖点,其他厂商还有什么理由继续应付用户?

“有用”经济学,谁在为AI的实际价值买单

如果说Metis代表的是技术侧对“效率”的追求,苹果代表的是产品侧对“入口”的争夺,那这周几条关于商业化的消息合在一起,说的其实是同一件事:AI行业正在经历一场从“能用”到“有用”的价值重构。

先看Stripe这条容易被忽视的新闻:他们发布了288项新功能,构建AI时代的经济基础设施。288项——这个数字本身就很变态。但我关注的不是数量,是逻辑。Stripe在做的是让AI公司能更简单地收钱、更简单地管理支付、更简单地做大模型公司的B端生意。换句话说,它在给AI经济建基础设施,而不是直接做AI应用。这里面的信号是:AI公司正在从“烧钱做技术”转向“认真做商业”,Stripe嗅到了这个需求。

再看GPT-5.5。OpenAI把API价格定到了“上一代的两倍”,这个定价策略其实很微妙。说白了,OpenAI的判断是:GPT-5.5的能力提升足够大,大到企业用户愿意为“确定性”付溢价。这和之前“大模型越来越便宜”的叙事正好相反——当模型能力拉开差距的时候,价格战逻辑就不适用了,有能力的玩家反而有理由提价。

Anthropic这边也在印证这个趋势:9000亿估值的新一轮融资如果落地,说明资本市场对头部AI公司的商业化预期依然非常乐观。这些钱不是投给“模型有多强”的,是投给“谁能最快把AI能力变现”的。

但这里有一个我比较警惕的点:整个行业正在形成一种“高端化”的叙事惯性,大家都盯着企业级市场、高端定价、亿元大单。这没错,但这意味着AI在普通消费者层面的落地速度可能会被忽视。说白了,当所有资源都往B端倾斜的时候,C端的“有用”体验谁来负责?如果AI对普通人的价值依然停留在“试试chatbot好不好玩”这个层面,那这波AI浪潮的实际社会价值就要打一个大大的问号。

开源与闭源的博弈:开放的不一定在退潮,收紧的不一定是保守

这周没有特别重磅的开源模型发布,但关于开源和闭源的趋势讨论值得单独拎出来说一说。

这两年行业里有一种观点很流行:开源AI会像开源软件一样最终赢得市场。但现实比这个观点复杂得多。Meta的Llama系列确实在开源社区引发了巨大反响,但Meta开源的战略目的从来不是“让AI民主化”这么简单——它是要通过开源建立生态壁垒,让更多开发者围绕Llama做应用,从而让Meta在应用层获得影响力。这和传统意义上“开源=开放=共享”的逻辑完全不同。

另一边,OpenAI和Anthropic的闭源策略越来越清晰:我要保持技术领先,所以我必须保持封闭。GPT-5.5的定价策略也好,Anthropic的企业级专注也好,背后都是同一个逻辑——在模型能力还处于快速迭代期的当下,闭源是保护技术优势最直接的手段。

所以现在的博弈本质上是:开源在抢占生态,闭源在收割利润。 两条路都能走通,但走法完全不同。开源模型的优势在于降低入场门槛、扩大开发者基数;闭源模型的优势在于品质可控、商业回报更直接。

对于普通开发者和企业来说,策略很现实:如果你要做差异化产品、底层能力依赖,闭源大厂模型是更靠谱的选择;如果你要做垂直场景、定制化方案,开源模型加上自己的微调和工程优化,性价比更高。这不是非此即彼的选择,是根据场景来的。

技术浪潮里,个体如何找到自己的位置

写了这么多,最后留一个开放性的问题给大家,也是我最近一直在思考的:

当AI工具越来越高效、AI平台越来越强大、AI能力越来越集中,作为个体——无论是开发者、创业者还是普通用户——我们该往哪里站?

Metis agent把冗余调用降了96%,这听起来是技术的胜利。但你有没有想过:AI越高效,对“人”的能力要求不是越低了,而是越高了?因为AI能替代的都是流程性、重复性的工作,而留下来的是AI做不了的——判断、审美、信任、决策。

这周Stripe在给AI公司建经济基础设施、Writer在挑战Salesforce和Microsoft、企业服务AI赛道的融资消息一个接一个。所有这些动作都在指向一个结论:AI的下一阶段,不是比谁的技术更先进,而是比谁能把技术和真实需求对接得更好。

所以问题来了:你所在的位置,是那个被优化的环节,还是那个做判断的人?

感谢阅读 · 欢迎探讨

如果你对今天分享有自己的见解,
欢迎在评论区一起聊聊。

✦ ✦ ✦