乐于分享
好东西不私藏

AI上半场看大力出奇迹,下半场看生态定生死

AI上半场看大力出奇迹,下半场看生态定生死

腾讯的汤道生最近抛出了”人工智能进入Harness时代”的论断。
Harness,马具之意,被引申为驯服AI这匹烈马的缰绳与鞍座。它并非模型本身,而是模型之外,由代码、配置、执行逻辑与反馈循环构成的工程体系。有了Harness,智能体才算真正走出实验室,进入生产线。
这个词,并非腾讯首创,但由一家昔日AI赛道的落后者明确提出论断,意味深长。
自ChatGPT问世至今,很长的时间内,行业共识几乎固化:腾讯在AI浪潮中,慢了字节不止半拍。字节豆包以惊人速度登顶AI原生应用日活榜首,其大模型在各类测评中与创业明星DeepSeek争辉。反观腾讯,元宝的用户规模不及豆包五分之一,混元大模型长期在第一梯队外围徘徊。
就在战局看似已定时,一个叫OpenClaw的开源项目,以及汤道生口中的Harness,让腾讯重新夺回了牌桌的焦点。
守成者的进化与挑战者的豪赌
AI对商业世界的冲击并不均衡。它像板块构造运动,离震中最近的最先感受到地动山摇。
字节跳动就站在震中。其核心业务,无论是短视频信息流推荐还是电商内容分发,本质都是在流量路径上搭建的收费站。当用户获取信息、寻找乐趣甚至吃瓜都可以直接求助于AI,抖音与头条的根基便会松动。
腾讯则不同。它的护城河是微信的社交关系链,只要人与人的连接需求不变,这道防线就相对稳固。AI再强大,也难以替代真实的情感互动。
危机感的差异决定了战略姿态。ChatGPT发布后,字节迅速反思”对机会的敏感度不如创业公司”。腾讯则显得从容,马化腾将AI比作电力革命,认为”早一个月把电灯泡拿出来,长期来看没那么重要”。
这并非保守,而是基于现实的理性选择。腾讯庞大的游戏与金融科技业务构成了坚实的战略缓冲带。相比于将身家性命押注于一场前途未卜的技术革命,将AI作为现有业务的增强剂,显然是更稳妥的路径。
过去两年,腾讯的AI战略更像一场降本增效运动。AI被嵌入了超过900个业务场景,在广告业务上,AI的应用使毛利率从55%提升至58%,连续两年驱动了约20%的同比增长。
字节没有这份从容。CEO梁汝波将AI视为”比PC+Web更大的行业核心机遇”,all in AI,赌的是下一个抖音。2025年,其净利润同比暴跌超过70%,核心原因正是对AI研发、算力基建和高端芯片的疯狂投入。字节迅速成为英伟达在亚洲的最大客户,国内AI人才密度最高的公司,甚至不惜分流抖音的预算来支持AI。
战略差异最终体现在产品与模型的产出上。字节下饺子般推出覆盖各类C端场景的AI原生应用,元宝的上线时间晚了豆包整整一年。字节大模型追求智能上限,腾讯混元则在能力上稍显逊色,一度陷入自研打基础、投资外部补能力的路径依赖。
中台的内耗与特种兵的突围
战略分野背后是更深层的组织矛盾。
2026年3月,腾讯撤销了运营近十年的AI Lab,这并非自毁长城,而是一场迟到了三年的组织纠偏。AI竞赛之初,腾讯沿用了移动互联网时代的成功经验,搭建了技术中台加业务联邦的架构。由TEG牵头负责沉淀AI能力,各业务事业群按需取用。
这套为效率而生的体系,在面对需要创造的AI革命时力不从心。工程师发现,仅仅是优化AI广告,就要面对分散在20多个系统中的数据,60%的时间都耗费在数据清洗与对齐上。各个业务线纷纷自建小模型,重复造轮子比比皆是。更尴尬的是,元宝诞生之初竟被划给了负责ToB业务的CSIG,无法借助微信或QQ的流量冷启动。
字节没有这种烦恼。它采用专项特种兵模式,将AI相关的两大单元Seed与Flow提升到与抖音平级的战略高度,直接由创始人负责。团队的唯一KPI就是把模型做出来、把产品做好,从根源上杜绝了内耗。
关键还在于将帅的选择。2025年初,前Google DeepMind研究副总裁吴永辉加入字节。同年10月,他正式升任AI一号位,迅速将团队重组为Edge、Focus、Base三层,全力打磨技术。
反观腾讯,长期缺少一位能一锤定音的权威话事人。在什么是好模型的标准缺失下,研发团队一度将重心放在刷榜上,将大量榜单题目与答案喂给模型,导致模型在评测时风光无限,真实场景中却频频翻车。
直到2025下半年,腾讯才开始艰难转身。先是为混元研发体系配备独立团队,收拢分散的算法力量。接着,前OpenAI核心成员姚顺雨于2025年12月被正式任命为首席AI科学家,直接向总裁汇报。他上任后迅速成立AI Infra部、AI Data部与数据计算平台部,意图打通算力、数据、算法的研发闭环。
真正的转折点,终于来了。
九十分的工具与六十分的陪伴
两家公司的基因差异烙印在各自的产品上。
字节第一款大模型Grace内测时,逻辑幻觉率高达30%。面对这样的半成品,字节的选择是立刻邀请五万名用户参与内测,调动上千人团队,将每一条差评、每一句吐槽都标记入库。历经42天高强度迭代,模型的中文语义理解准确率被拉升到56%。
这是典型的字节式打法,允许产品以60分的状态上线,在真实用户反馈中快速迭代逼近100分。这种从推荐算法时代就深入骨髓的试验哲学,在AI探索的无人区尤为有效。
腾讯无法如此奔放。它的核心产品承载着13亿用户的数字生活,维系着数百万中小企业的生计。这种公共事业色彩,让腾讯必须戴着安全可靠的镣铐跳舞。产品必须打磨到90分才敢上线。
混元大模型经历了比同行更长的内部灰度测试。元宝的产品定位选择了更稳妥的效率工具方向,围绕办公、学习等场景迭代。它或许是市面上最会搜索、总结和写作的AI之一。
问题在于,随着技术普及,写文案这类基础能力的差距正迅速被抹平。纯粹的效率工具很难建立起用户黏性。
豆包选择了另一条路–智能好友。它推出覆盖不同性格和场景的预置智能体,并能记住用户的偏好与历史对话。当用户发现可以教豆包唱歌、陪自己斗嘴时,一种全新的情感互动关系诞生了。这种类人伴侣的定位,精准击中了需要情感陪伴的更大众用户。

从模型之争到Harness之战
输掉上半场的腾讯并非没有机会。
随着OpenClaw为代表的Agent技术兴起,竞争范式正在改变。上半场比拼的是模型生成对话和图片的能力,核心是大脑的智商。下半场比拼的是AI调用工具、完成多步骤复杂任务的能力,核心是躯干与四肢的执行力。
这就是Harness的价值。它为聪明的大脑提供了可交互的环境、可调用的工具、可记忆的系统以及可遵循的规则,让AI从一个聊天家进化为行动者。
在这场新竞争中,场景和生态成了新的胜负手。腾讯能一口气推出WorkBuddy、QClaw等一系列Agent产品,背后站着微信、小程序、腾讯文档、腾讯会议等国民级协作与服务生态。当腾讯明确提出要在微信里做一个懂你、能干的AI Agent时,它能调动的生态资源,是任何对手都无法比拟的。
刻在腾讯骨子里的工程理性和克制,让它率先直面AI无法可靠评价自己的难题,并将Harness这个约束智能体的缰绳从幕后推到台前。这不仅是技术路线的调整,更可能开辟一个全新的蓝海赛道。
字节同样拥有飞书、电商、短视频构成的生态。但它也需要在AI的可靠性、安全性上补课。这个短暂的时间窗口,正是腾讯追赶的机会。
腾讯与字节在AI赛道上的攻防易位,揭示了一个深刻的现实:技术浪潮的不同阶段,会选择不同基因的赢家。上半夜,字节的大力出奇迹与快速迭代,完美契合了技术跃迁期的范式。到了下半夜,当竞争焦点转向工程落地与生态整合时,腾讯的系统性力量与深厚积淀,或许能让它上演后发制人的经典戏码。