腾讯与字节的AI时差:1200天-夜雨聆风

腾讯与字节的AI时差:1200天

数日前，腾讯副总裁汤道生发表了一篇文章《人工智能正式进入Harness时代》，在科技圈激起不小的回响。

“Harness”一词原指马具、缰绳，如今被引申为“拉住AI这匹脱缰野马的力量”——有了Harness，智能体便获得了工作工具、文件系统、反馈回路与验收标准，运行更加安全可靠。

这是腾讯作为科技巨头，首次在AI赛道上如此鲜明地发出时代强音。

此时，距离2022年ChatGPT震撼全球，已过去1200多天。在此期间，创业公司DeepSeek曾惊艳海内外；阿里等大平台也搭建起从芯片、云计算、模型到应用与商业化的全栈能力。

尤其值得关注的是字节跳动——豆包稳居AI原生App活跃用户榜首，日均Token消耗量国内第一、全球第三；Seedance已成为AI视频生成领域的行业标杆，在多项权威测评中屡次登顶。

相比之下，腾讯元宝的月活跃用户尚不足豆包的五分之一；混元大模型长期未能进入通用大模型第一梯队。这位昔日霸主在AI竞赛中落后于字节，几乎已成为一种共识。

直到OpenClaw的出现，将AI竞争的焦点从“聊天机器人”迅速拉向“智能体”，腾讯才借“养虾”“养马”等场景重新站回舞台中央。

复盘腾讯从落后字节到奋力追赶的全过程，会发现AI淘汰的从来不是“起步稍慢”的选手，而是看不见新范式的参与者。它平等地考验着每一家科技巨头的战略眼光、组织效率、产品能力，乃至企业基因。

在这场漫长的角逐中，真正决定胜负的，是那股沉默却不可抗拒的系统力量。

战略分野：造物豪赌VS理性进化

过去的互联网商业模式，本质是在流量通路上“筑墙收租”；而到了AI时代，墙虽在，路却消失了。

最新一份研究对比了排名前五的生成式AI与前六的搜索引擎，发现AI平台的访问量已攀升至全球搜索总量的56%。在国内，连六十岁的老人都开始用AI查资讯、搜八卦，“吃瓜”也离不开AI了。

当人们看段子、学技能不再需要去抖音“刷”、去今日头条“搜”，打开AI就能直接搞定时，用户对这些传统APP的需求将逐渐回归娱乐本身，对穿插其中的广告也会越来越失去耐心。

不过，无论AI多强大，短时间内依然难以取代用户与微信好友之间那种真实的情感互动。因此，社交平台上的广告，依然能保持相对稳定的根基。

显然，站在AI冲击最前线的字节跳动，与处于最后一道防线的腾讯，面临的危机感根本不在一个量级。

ChatGPT引爆全球科技浪潮后，字节立刻反思“对机会的敏感度还不如创业公司”；而腾讯则颇为淡定，马化腾将AI比作电力革命，“早一个月把电灯泡拿出来，长期看没那么重要”。

考虑到腾讯历来有“等技术成熟再切入”的传统，这番表态被外界解读为“等着摘桃子”。但腾讯的“慢”与“保守”，背后是生存并未受到直接威胁——游戏、金融科技等多元业务构成了足够的缓冲垫。

比起All in技术革命，腾讯似乎更倾向 “让AI为鹅厂打工”。

“表外表里”在编稿时就发现，公众号后台已经支持文生图：敲下关键词，库存AI图片就会自动弹出；即便提示词很简短，系统也会自动扩写，全程无需复杂操作，十几秒就能得到一张插图。

而这样被AI再造的场景，用腾讯的话说“有900多个”，覆盖广告、游戏等业务。其中，广告业务在AI加持下，连续两年实现约20%的同比增长，毛利率由55%提升至58%。

可见，腾讯最初的策略很明确：把AI嵌入既有业务，提升效率与变现能力，进一步加固自己的生态护城河。

字节则截然不同。CEO梁汝波将AI视为“比PC+Web更大的行业级机遇”，押注AI就是押注“下一个抖音”。这种紧迫感与彻底性，推动向来信奉“没什么不能自己干”的字节，坚定走上了自研之路。

更深层看，字节也缺少腾讯那份“生在罗马”的先天优势。

两家巨头都手握海量数字资产，字节的体量甚至更大，但其高价值、高壁垒的数据未必充足——短视频与直播电商的经验更多沉淀在“情绪”和“消费”层面。相比之下，以社交和支付起家的腾讯，更擅长理解“对话”与“人的意图”，而这恰恰是AI从“感知”迈向“认知”的关键。

这种微妙差异，在双方的行动中同样可见一斑：字节向外拓展，通过豆包手机和ToB的MaaS业务不断积累数据；腾讯则向内吸纳，将DeepSeek等大模型部署在内部GPU上，让成熟技术为自己服务。

两家由此形成了“造物”与“进化”的战略分野，深刻左右了它们在AI上的资源倾斜与推进节奏。

字节持续激进加码，不仅成为英伟达在亚洲的最大客户，也跃居国内AI人才密度最高的企业，甚至不惜削减抖音的预算来反哺AI。2025年其净利润骤降70%，一个重要原因正是“AI投入太大”。

腾讯则选择了降本增效的路线。技术中台TEG被要求自负盈亏，内部事业群若想训练模型，一度需要向总办专门打报告。马化腾甚至告诫AI团队：“别高估自己的能力”“别想着什么都自己干”。

过去两年，字节像“下饺子”一样推出AI原生应用，覆盖聊天、长文本生成、图片生成等C端高频场景；而腾讯元宝比豆包晚了一年才上线。字节的底层大模型追求“智能上限”，腾讯的混元大模型能力相对薄弱，陷入“自研地基+投资/接入外部大模型”的路径依赖。

从技术落地的广度和深度来看，腾讯自起步就被字节拉开了差距。同时，战略的不同也造成了迥异的组织架构，进一步拖累了腾讯的脚步。

上个月底，腾讯一则内部通知，正式解散了运营近十年、曾承载公司“AI野心”的AI Lab。

在战事正酣之际，先把自己的阵地拆了，听上去颇为荒唐。但这并非自毁长城，而是一场迟来三年的组织纠偏。

2023年AI战火燃起后，腾讯迅速拉起了一支“大模型突击队”——由TEG（技术工程事业群）牵头，并从游戏、微信等事业群抽调人手协同作战。

在腾讯的设想中，这套“技术中台+业务联邦”的架构，既能沉淀底层AI能力，又能让各事业群灵活调用、激发创新，如同移动互联网时代，擅长“流量变现”的游戏业务与坚守“体验至上”的微信各司其职、相得益彰。

而将AI视为下一代流量入口的字节，则选择了“大力出奇迹”的路线：Seed（基础模型研究）与Flow（AI产品创新）两大独立单元实行“研用分离”，且两者均与抖音平起平坐，同属“创始人工程”。

正是这道组织设计上的分水岭，让两家巨头在AI赛道上渐行渐远。

腾讯的工程师们，光是围绕AI广告优化就已焦头烂额：业务数据散落在20多个系统里，格式、质量、标准参差不齐，团队60%的精力都耗在找数据、清洗数据上。③

不止广告，微信、游戏等业务也在各自搭建小模型，甚至游戏业务的四大工作室纷纷“赛马”。这虽然加速了AI的落地渗透，但也意味着，可能有数百位工程师在做重复的“造轮子”工作，资源在无形中被大量浪费。

不集中力量，难以攻坚；但要真正打破部门壁垒、从零孵化一个“新微信”或“新王者荣耀”，无异于一场“自我革命”。于是，一个尴尬的局面出现了：面向C端的元宝在诞生之初，既没有借助QQ浏览器导流，也无法获得微信的冷启动支持，反而被划归到ToB的云与智慧产业事业群。

字节跳动则没有“左右手互搏”的困扰。在专项模式下，团队唯一的KPI就是“把大模型做出来、把产品做好”，无需在不同业务部门之间周旋，从根源上杜绝了内耗。

更关键的是，字节拥有腾讯难以企及的“技术领军人物”。

字节AI的首任负责人是朱文佳，曾任今日头条CEO、TikTok产品技术负责人，并非纯粹的AI背景出身。这一点与腾讯前两任AI掌舵人有相似之处——张正友是计算机视觉领域的顶级学者，蒋杰则来自腾讯广告技术体系。

然而，字节对“模型天花板”的焦虑，驱使其不惜重金引入全球顶尖AI人才。2025年初，Google DeepMind研究副总裁吴永辉加盟字节，成为新的技术领军人。他随后将团队重组为三层：Edge（前沿探索）、Focus（模型攻坚）、Base（工程与交付），持续打磨底层技术。

再加上朱文佳等老将的协同配合，AI能力得以更顺畅地融入产品之中。正是在这一时期，豆包的用户数据迎来了爆发式增长。

反观腾讯，长期缺乏一位能够一锤定音的权威技术领袖。无人拍板“什么是好模型”，工程师们为了完成KPI，只能依赖最直观的指标——各大权威榜单。

为了刷出漂亮成绩，研发团队将大量榜单题目及其答案语料“投喂”给模型，导致数据严重污染。模型在评测中风光无限，到了真实用户面前却频频“翻车”，被吐槽“不好用”。

意识到问题后，腾讯开始艰难转身。2025年上半年，公司为混元研发体系配备了独立团队，将此前分散的算法力量收拢集中；同时把元宝、QQ浏览器等AI相关团队全部划归CSIG（云与智慧产业事业群），形成面向C端的统一战线。

紧接着，年底挖来前OpenAI核心成员姚顺雨，任命为首席科学家，赋予其大模型研发的绝对指挥权。在他主导下，腾讯成立了AI Infra部、AI Data部与数据计算平台部，打通了“算力—数据—算法”的研发闭环。

真正的转折来了，可惜腾讯想追赶字节，仍有挣不脱的铁链。

产品枷锁：谨慎的“效率工具”VS大胆的“智能好友”

同样是测试首款大模型，腾讯与字节的思路却截然不同。

字节大模型Grace（豆包前身）在内测时，逻辑幻觉率一度高达30%。字节随即邀请5万名内测用户，调动上百名技术骨干、上千人的标注团队，将每一条差评、每一次吐槽都记录入库。经过整整42天、每天修正超10万条对话的努力，模型的中文语义理解准确率终于提升至56%。

与此同时，腾讯的混元大模型也在与幻觉、推理延迟等问题缠斗，但外界鲜有人知——混元已在腾讯云、腾讯广告等业务中灰度运行了近6个月，传闻内部评分达到90分后才正式对外发布，成为“大厂中亮相最晚的大模型”。

一个敢于快速试错，另一个则谨慎慢跑，背后折射出两家巨头截然不同的基因与体质。

对于从推荐算法中炼出抖音的字节而言，“试验”本身就是产品哲学的核心。豆包相关负责人曾坦言：“AI产品探索进入无人区后，不必先纠结技术或路线，理想态先行。”换句话说，就是允许先上线60分的产品，然后通过反复测试、反馈与迭代，将其打磨到100分，并最终形成“飞轮效应”。

但对以社交为根基的腾讯而言，把用户视为极致工程概率下的“实验样本”，很可能是一场灾难。

腾讯的核心产品承载着13亿人的数字生活、500万家中小企业的生计以及无数政务系统的运转——这恰恰是其引以为傲的护城河。但代价是，这家科技巨头也因此染上了某种“公共事业”色彩，不得不戴着“安全、可靠”的镣铐起舞。

正因如此，腾讯的产品往往要打磨到90分才允许上线。AI产品的开发也不例外：混元大模型经历了比同行更漫长的内部灰度测试；元宝则选择了更为普适的“效率工具”定位，围绕办公、学习等场景中的痛点持续迭代，如今已成为最擅长搜索、总结与写作的生成式AI之一。

但随着各家大模型持续进化，写文案、信息总结这类基础能力的差距已被拉至微乎其微。元宝的差异化优势逐渐消散，慢慢变得“泯然众人”。

更为关键的是，在破坏性创新的浪潮中，唯有敢于颠覆想象、大量试错，才有机会触达技术的边界，真正释放AI的价值。

豆包正是沿着这一路径前进。瞄准“类人伴侣”的定位后，它一口气推出22个预设“智能体”，覆盖闲聊、恋爱顾问等场景，性格各异，且能记住用户的偏好与历史对话。网友们发现豆包可以“调教”之后，开始教AI唱歌、拌嘴，这些“野生”的玩法反过来又推动豆包越来越像一个真实的“人”。

一个懂梗、会聊天、有情绪的“智能好友”，相比于冷冰冰的“办公工具”，更能打动那些基数庞大、对技术不敏感却渴望情感陪伴的普通用户。也正因如此，在用户黏性上，豆包已经远远甩开了元宝。

不过，输掉“AI上半场”的腾讯，并非没有翻盘的底牌。

正如开篇所言，随着“龙虾”引爆市场，AI竞争的焦点正加速向智能体与垂直行业应用迁移——游戏规则再次被改写：当比拼的是生成对话、图片、视频时，模型能力越强优势越大；但一旦任务升级为调用API、完成多步骤工作流，场景与生态便成为新的决胜变量。

腾讯之所以能一口气推出5款Agent产品，成为新一轮竞赛中的领跑者，底气正来自于微信、小程序、腾讯文档、腾讯会议等一整套协作与服务生态。管理层已明确表态，要 “在微信里打造一个懂你、能干的AI Agent”——这在全行业是独一无二的布局。

与此同时，刻在腾讯骨子里的理性与克制，使其没有回避“AI无法可靠评价自己”这一难题。在思考如何约束智能体的过程中，腾讯将Harness从幕后推向了台前。而这，本身就是一个全新的蓝海赛道。

或许在不久的将来，鹅厂“后发制人”的故事真的会再次上演。

当然，字节同样拥有飞书、电商、短视频等生态，但它仍需在深度、安全等方面补课——这恰恰为腾讯留下了宝贵的追赶窗口。

小结

腾讯与字节在AI赛道上的此消彼长，揭示了一个更深层的真相：决定成败的并非战略本身，而是时代在不同阶段选择了不同的赢家。

上半场，字节的打法恰好踩中了技术跃迁的节奏；下半场，腾讯的路径也未必会一直落后。

因此，真正的胜负从来不在于一城一池的较量，而在于——无论潮水流向何方，企业能否始终保有自我进化的能力。