乐于分享
好东西不私藏

腾讯与字节的AI时差:1200天

腾讯与字节的AI时差:1200天

数日前,腾讯副总裁汤道生发表了一篇文章《人工智能正式进入Harness时代》,在科技圈激起不小的回响。

“Harness”一词原指马具、缰绳,如今被引申为“拉住AI这匹脱缰野马的力量”——有了Harness,智能体便获得了工作工具、文件系统、反馈回路与验收标准,运行更加安全可靠。

这是腾讯作为科技巨头,首次在AI赛道上如此鲜明地发出时代强音。

此时,距离2022年ChatGPT震撼全球,已过去1200多天。在此期间,创业公司DeepSeek曾惊艳海内外;阿里等大平台也搭建起从芯片、云计算、模型到应用与商业化的全栈能力。

尤其值得关注的是字节跳动——豆包稳居AI原生App活跃用户榜首,日均Token消耗量国内第一、全球第三;Seedance已成为AI视频生成领域的行业标杆,在多项权威测评中屡次登顶。

相比之下,腾讯元宝的月活跃用户尚不足豆包的五分之一;混元大模型长期未能进入通用大模型第一梯队。这位昔日霸主在AI竞赛中落后于字节,几乎已成为一种共识。

直到OpenClaw的出现,将AI竞争的焦点从“聊天机器人”迅速拉向“智能体”,腾讯才借“养虾”“养马”等场景重新站回舞台中央。

复盘腾讯从落后字节到奋力追赶的全过程,会发现AI淘汰的从来不是“起步稍慢”的选手,而是看不见新范式的参与者。它平等地考验着每一家科技巨头的战略眼光、组织效率、产品能力,乃至企业基因。

在这场漫长的角逐中,真正决定胜负的,是那股沉默却不可抗拒的系统力量

战略分野:造物豪赌VS理性进化

过去的互联网商业模式,本质是在流量通路上“筑墙收租”;而到了AI时代,墙虽在,路却消失了。

最新一份研究对比了排名前五的生成式AI与前六的搜索引擎,发现AI平台的访问量已攀升至全球搜索总量的56%。在国内,连六十岁的老人都开始用AI查资讯、搜八卦,“吃瓜”也离不开AI了。

当人们看段子、学技能不再需要去抖音“刷”、去今日头条“搜”,打开AI就能直接搞定时,用户对这些传统APP的需求将逐渐回归娱乐本身,对穿插其中的广告也会越来越失去耐心。

不过,无论AI多强大,短时间内依然难以取代用户与微信好友之间那种真实的情感互动。因此,社交平台上的广告,依然能保持相对稳定的根基。

显然,站在AI冲击最前线的字节跳动,与处于最后一道防线的腾讯,面临的危机感根本不在一个量级

ChatGPT引爆全球科技浪潮后,字节立刻反思“对机会的敏感度还不如创业公司”;而腾讯则颇为淡定,马化腾将AI比作电力革命,“早一个月把电灯泡拿出来,长期看没那么重要”。

考虑到腾讯历来有“等技术成熟再切入”的传统,这番表态被外界解读为“等着摘桃子”。但腾讯的“慢”与“保守”,背后是生存并未受到直接威胁——游戏、金融科技等多元业务构成了足够的缓冲垫。

比起All in技术革命,腾讯似乎更倾向 “让AI为鹅厂打工”

“表外表里”在编稿时就发现,公众号后台已经支持文生图:敲下关键词,库存AI图片就会自动弹出;即便提示词很简短,系统也会自动扩写,全程无需复杂操作,十几秒就能得到一张插图。

而这样被AI再造的场景,用腾讯的话说“有900多个”,覆盖广告、游戏等业务。其中,广告业务在AI加持下,连续两年实现约20%的同比增长,毛利率由55%提升至58%。

可见,腾讯最初的策略很明确:把AI嵌入既有业务,提升效率与变现能力,进一步加固自己的生态护城河。

字节则截然不同。CEO梁汝波将AI视为“比PC+Web更大的行业级机遇”,押注AI就是押注“下一个抖音”。这种紧迫感与彻底性,推动向来信奉“没什么不能自己干”的字节,坚定走上了自研之路。

更深层看,字节也缺少腾讯那份“生在罗马”的先天优势。

两家巨头都手握海量数字资产,字节的体量甚至更大,但其高价值、高壁垒的数据未必充足——短视频与直播电商的经验更多沉淀在“情绪”和“消费”层面。相比之下,以社交和支付起家的腾讯,更擅长理解“对话”与“人的意图”,而这恰恰是AI从“感知”迈向“认知”的关键。

这种微妙差异,在双方的行动中同样可见一斑:字节向外拓展,通过豆包手机和ToB的MaaS业务不断积累数据;腾讯则向内吸纳,将DeepSeek等大模型部署在内部GPU上,让成熟技术为自己服务。

两家由此形成了“造物”与“进化”的战略分野,深刻左右了它们在AI上的资源倾斜与推进节奏

字节持续激进加码,不仅成为英伟达在亚洲的最大客户,也跃居国内AI人才密度最高的企业,甚至不惜削减抖音的预算来反哺AI。2025年其净利润骤降70%,一个重要原因正是“AI投入太大”。

腾讯则选择了降本增效的路线。技术中台TEG被要求自负盈亏,内部事业群若想训练模型,一度需要向总办专门打报告。马化腾甚至告诫AI团队:“别高估自己的能力”“别想着什么都自己干”。

过去两年,字节像“下饺子”一样推出AI原生应用,覆盖聊天、长文本生成、图片生成等C端高频场景;而腾讯元宝比豆包晚了一年才上线。字节的底层大模型追求“智能上限”,腾讯的混元大模型能力相对薄弱,陷入“自研地基+投资/接入外部大模型”的路径依赖。

从技术落地的广度和深度来看,腾讯自起步就被字节拉开了差距。同时,战略的不同也造成了迥异的组织架构,进一步拖累了腾讯的脚步。

上个月底,腾讯一则内部通知,正式解散了运营近十年、曾承载公司“AI野心”的AI Lab。

在战事正酣之际,先把自己的阵地拆了,听上去颇为荒唐。但这并非自毁长城,而是一场迟来三年的组织纠偏。

2023年AI战火燃起后,腾讯迅速拉起了一支“大模型突击队”——由TEG(技术工程事业群)牵头,并从游戏、微信等事业群抽调人手协同作战。

在腾讯的设想中,这套“技术中台+业务联邦”的架构,既能沉淀底层AI能力,又能让各事业群灵活调用、激发创新,如同移动互联网时代,擅长“流量变现”的游戏业务与坚守“体验至上”的微信各司其职、相得益彰。

而将AI视为下一代流量入口的字节,则选择了“大力出奇迹”的路线:Seed(基础模型研究)与Flow(AI产品创新)两大独立单元实行“研用分离”,且两者均与抖音平起平坐,同属“创始人工程”。

正是这道组织设计上的分水岭,让两家巨头在AI赛道上渐行渐远。

腾讯的工程师们,光是围绕AI广告优化就已焦头烂额:业务数据散落在20多个系统里,格式、质量、标准参差不齐,团队60%的精力都耗在找数据、清洗数据上。③

不止广告,微信、游戏等业务也在各自搭建小模型,甚至游戏业务的四大工作室纷纷“赛马”。这虽然加速了AI的落地渗透,但也意味着,可能有数百位工程师在做重复的“造轮子”工作,资源在无形中被大量浪费。

不集中力量,难以攻坚;但要真正打破部门壁垒、从零孵化一个“新微信”或“新王者荣耀”,无异于一场“自我革命”。于是,一个尴尬的局面出现了:面向C端的元宝在诞生之初,既没有借助QQ浏览器导流,也无法获得微信的冷启动支持,反而被划归到ToB的云与智慧产业事业群。

字节跳动则没有“左右手互搏”的困扰。在专项模式下,团队唯一的KPI就是“把大模型做出来、把产品做好”,无需在不同业务部门之间周旋,从根源上杜绝了内耗。

更关键的是,字节拥有腾讯难以企及的“技术领军人物”。

字节AI的首任负责人是朱文佳,曾任今日头条CEO、TikTok产品技术负责人,并非纯粹的AI背景出身。这一点与腾讯前两任AI掌舵人有相似之处——张正友是计算机视觉领域的顶级学者,蒋杰则来自腾讯广告技术体系。

然而,字节对“模型天花板”的焦虑,驱使其不惜重金引入全球顶尖AI人才。2025年初,Google DeepMind研究副总裁吴永辉加盟字节,成为新的技术领军人。他随后将团队重组为三层:Edge(前沿探索)、Focus(模型攻坚)、Base(工程与交付),持续打磨底层技术。

再加上朱文佳等老将的协同配合,AI能力得以更顺畅地融入产品之中。正是在这一时期,豆包的用户数据迎来了爆发式增长。

反观腾讯,长期缺乏一位能够一锤定音的权威技术领袖。无人拍板“什么是好模型”,工程师们为了完成KPI,只能依赖最直观的指标——各大权威榜单。

为了刷出漂亮成绩,研发团队将大量榜单题目及其答案语料“投喂”给模型,导致数据严重污染。模型在评测中风光无限,到了真实用户面前却频频“翻车”,被吐槽“不好用”。

意识到问题后,腾讯开始艰难转身。2025年上半年,公司为混元研发体系配备了独立团队,将此前分散的算法力量收拢集中;同时把元宝、QQ浏览器等AI相关团队全部划归CSIG(云与智慧产业事业群),形成面向C端的统一战线。

紧接着,年底挖来前OpenAI核心成员姚顺雨,任命为首席科学家,赋予其大模型研发的绝对指挥权。在他主导下,腾讯成立了AI Infra部、AI Data部与数据计算平台部,打通了“算力—数据—算法”的研发闭环。

真正的转折来了,可惜腾讯想追赶字节,仍有挣不脱的铁链。

产品枷锁:谨慎的“效率工具”VS大胆的“智能好友”

同样是测试首款大模型,腾讯与字节的思路却截然不同。

字节大模型Grace(豆包前身)在内测时,逻辑幻觉率一度高达30%。字节随即邀请5万名内测用户,调动上百名技术骨干、上千人的标注团队,将每一条差评、每一次吐槽都记录入库。经过整整42天、每天修正超10万条对话的努力,模型的中文语义理解准确率终于提升至56%。

与此同时,腾讯的混元大模型也在与幻觉、推理延迟等问题缠斗,但外界鲜有人知——混元已在腾讯云、腾讯广告等业务中灰度运行了近6个月,传闻内部评分达到90分后才正式对外发布,成为“大厂中亮相最晚的大模型”。

一个敢于快速试错,另一个则谨慎慢跑,背后折射出两家巨头截然不同的基因与体质

对于从推荐算法中炼出抖音的字节而言,“试验”本身就是产品哲学的核心。豆包相关负责人曾坦言:“AI产品探索进入无人区后,不必先纠结技术或路线,理想态先行。”换句话说,就是允许先上线60分的产品,然后通过反复测试、反馈与迭代,将其打磨到100分,并最终形成“飞轮效应”。

但对以社交为根基的腾讯而言,把用户视为极致工程概率下的“实验样本”,很可能是一场灾难。

腾讯的核心产品承载着13亿人的数字生活、500万家中小企业的生计以及无数政务系统的运转——这恰恰是其引以为傲的护城河。但代价是,这家科技巨头也因此染上了某种“公共事业”色彩,不得不戴着“安全、可靠”的镣铐起舞

正因如此,腾讯的产品往往要打磨到90分才允许上线。AI产品的开发也不例外:混元大模型经历了比同行更漫长的内部灰度测试;元宝则选择了更为普适的“效率工具”定位,围绕办公、学习等场景中的痛点持续迭代,如今已成为最擅长搜索、总结与写作的生成式AI之一。

但随着各家大模型持续进化,写文案、信息总结这类基础能力的差距已被拉至微乎其微。元宝的差异化优势逐渐消散,慢慢变得“泯然众人”。

更为关键的是,在破坏性创新的浪潮中,唯有敢于颠覆想象、大量试错,才有机会触达技术的边界,真正释放AI的价值。

豆包正是沿着这一路径前进。瞄准“类人伴侣”的定位后,它一口气推出22个预设“智能体”,覆盖闲聊、恋爱顾问等场景,性格各异,且能记住用户的偏好与历史对话。网友们发现豆包可以“调教”之后,开始教AI唱歌、拌嘴,这些“野生”的玩法反过来又推动豆包越来越像一个真实的“人”。

一个懂梗、会聊天、有情绪的“智能好友”,相比于冷冰冰的“办公工具”,更能打动那些基数庞大、对技术不敏感却渴望情感陪伴的普通用户。也正因如此,在用户黏性上,豆包已经远远甩开了元宝。

不过,输掉“AI上半场”的腾讯,并非没有翻盘的底牌

正如开篇所言,随着“龙虾”引爆市场,AI竞争的焦点正加速向智能体与垂直行业应用迁移——游戏规则再次被改写:当比拼的是生成对话、图片、视频时,模型能力越强优势越大;但一旦任务升级为调用API、完成多步骤工作流,场景与生态便成为新的决胜变量

腾讯之所以能一口气推出5款Agent产品,成为新一轮竞赛中的领跑者,底气正来自于微信、小程序、腾讯文档、腾讯会议等一整套协作与服务生态。管理层已明确表态,要 “在微信里打造一个懂你、能干的AI Agent”——这在全行业是独一无二的布局。

与此同时,刻在腾讯骨子里的理性与克制,使其没有回避“AI无法可靠评价自己”这一难题。在思考如何约束智能体的过程中,腾讯将Harness从幕后推向了台前。而这,本身就是一个全新的蓝海赛道。

或许在不久的将来,鹅厂“后发制人”的故事真的会再次上演。

当然,字节同样拥有飞书、电商、短视频等生态,但它仍需在深度、安全等方面补课——这恰恰为腾讯留下了宝贵的追赶窗口。

小结

腾讯与字节在AI赛道上的此消彼长,揭示了一个更深层的真相:决定成败的并非战略本身,而是时代在不同阶段选择了不同的赢家。

上半场,字节的打法恰好踩中了技术跃迁的节奏;下半场,腾讯的路径也未必会一直落后。

因此,真正的胜负从来不在于一城一池的较量,而在于——无论潮水流向何方,企业能否始终保有自我进化的能力。