6月5号周五,腾讯云AI产业应用大会。汤道生和姚顺雨坐下来聊了将近两个小时。
看完有一个感觉:之前两篇我聊的都是腾讯"值多少钱",”有什么底牌“,这一篇想聊聊它"往哪走"。
前两篇的结论还记得的话:432的时候便宜到几乎不需要精确估值,6月2号涨了10.46%说明市场开始重新看腾讯AI了。但"AI"这两个字太笼统——腾讯在AI上到底怎么想的、怎么做?这场对话讲的就是这个。
分享下我的理解:腾讯对这场AI比赛的理解和判断和别人不一样。
AI不是一条赛道
汤道生说了一句话:"AI是长跑,是多维度的竞赛。"
多数人把AI当单赛道——谁的模型参数大谁赢,谁的benchmark分数高谁赢,像百米冲刺排名次。但"多维度"的意思是,AI更像综合运动会:有人短跑厉害,有人游泳厉害,你用一项金牌定不了总冠军。
姚顺雨从另一个角度说了同一件事。他说AI的版图远不只是一条大模型基础设施——Agent、多模态、具身智能、物理机器人,这些都是AI,而且"新事物刚刚发生"。如果你把AI的竞争只理解为谁先做出最强的基座模型,就像70年代把计算机产业的竞争理解为谁先做出最大的主机。
他还有一句话信息量很大:"方法论已经成熟,预训练+后训练就是一把万能锤子。寻找好问题比寻找好方法更困难。"
锤子大家都有了,差距不在锤子大小,在于你往哪敲。
移动互联网就是现成的参照。做APP的方法论当年也是一把万能锤子,谁都会写代码。但最后赢的不是方法论最好的团队——微信定义了"人和人怎么连接",美团定义了"人和服务怎么连接",抖音定义了"人和内容怎么连接"。AI也一样,方法论会越来越标准化,但问题定义能力不会。
快与慢的辩证
"腾讯是不是慢了?"——过去两年被问得最多的问题之一。
姚顺雨的回答不是简单的"不慢"或"慢了但有道理",而是一个判断:"我不认为ChatGPT和Claude Code会是唯一的super APP。今天像70年代PC刚产生。"
70年代的PC产业,赢的不是最早的公司。Altair 8800是1975年出的,Apple I是1976年,但最后赢的是1981年的IBM PC和后来的兼容机生态。先发优势存在,但远没到决定性的程度。
汤道生说得也坦诚:"我们是一个非常多业态的公司,有些地方做得快了,有的地方做得慢了。" 但他补了一句关键的话——"这是一个长跑,这是一个马拉松,腾讯还是有非常丰富的场景。"
我把这两位的话合在一起理解:如果AI是短期冲刺,那起跑慢了确实吃亏。但如果AI是马拉松,而且才刚开始跑——那前几公里的快慢,不是决定性的。决定性的是你有没有跑到终点的体力和路径。
6月2号那根10.46%的大阳线,背后就是市场对腾讯AI节奏变化的认可。但那是短期信号。长期看,腾讯AI的底牌不在单次发布,在它这套打法本身。
不是先做模型,再找场景
很多公司的路径是:先做一个通用大模型,再找场景落地。
姚顺雨提出的方法论叫Co-Design——模型和产品一起设计、一起迭代。我把它理解成三层:
第一层,预训练要做扎实。 这是产品无关的——不管你做什么产品,底层能力要solid。混元3的Infrastructure重建,核心就是回到这个原则。
第二层,后训练要面向产品做正确的Eval。 这一点特别关键。姚顺雨强调"实用性优先,不是刷榜优先"。原话是:"产品中多轮遵循等能力,与Benchmark差异很大。" 说白了:考场上考了满分,不代表干实际活也行。有些能力考试考不出来,只有到了真实场景里才知道行不行。
他还直说了:"中国大家有个不好的倾向是大家喜欢刷榜。"
第三层,产品要体系化。 单点能力做出来不算什么,关键能力能不能迁移?从元宝训练出来的聊天和搜索能力,可以迁移到ima、腾讯文档等其他腾讯产品。不同产品提供不同数据,数据之间相互泛化,形成网络效应。
但这里面有个难点,汤道生点出来了:多角色对齐。做模型的人和做产品的人,目标天然有不一致的地方——模型人要能力越强越好,产品人要用户需求满足越好。标准对不齐,模型行为就不可预测。
姚顺雨怎么解决的?他做了件很实际的事——直接派后训练最强的骨干去帮元宝团队做后训练。"当时很多算法同学不理解",但这一步让产品团队意识到模型的人是真的在为产品着想。信任不是靠流程建立的,是靠一起干活建立的。
简单说,大模型要做,还要和产品/应用场景/数据一起协同着来做,充分利用自家优势。 带来的结果,我理解是:腾讯的大模型可能不是最强大的,但按照这套打法做出来的,大概率会是最接地气、最好用的——有没有感受到腾讯一贯的特点?
三个能力
聊完方法论,说具体能力。汤道生在大会上正式发布了腾讯的三个核心能力。
场景联接。 AI的能力是在场景中长出来的,不是在实验室里。有模型没场景,就是空中楼阁。场景给模型提供什么?Context。上下文。姚顺雨说得很直白:"模型越来越擅长把复杂输入变成输出,你的竞争壁垒就来自于你有没有最原始的输入。" 微信、QQ、腾讯文档、腾讯会议……这些场景积累的Context,是腾讯AI的隐形资产。
工程驾驭。 从"能跑"到"能稳定跑",中间隔着一道巨大的鸿沟。模型在线上怎么保证稳定性?怎么处理edge case?高并发下怎么不崩?这些问题的答案不在paper里,在工程实践里。姚顺雨原话:"今天做大模型从算法角度看是比较Trivial的事情,真正的功力在Infrastructure、数据和Eval。"
模型驱动。 这个不是说模型驱动一切,而是说AI能力不是买来的,是长出来的。你可以买算力、挖人,但你买不来"长出来的能力"——团队对模型的理解越来越深,对什么该做什么不该做的判断越来越准。这个过程没法加速,只能自己干。
三个能力不是孤立的。场景联接提供Context和数据,工程驾驭保证稳定性,模型驱动让能力持续积累。合在一起,才是完整的图。
性价比的前提是性能
这个观点值得单独说。
姚顺雨说:"很多人发现用更强的模型反而更省钱,因为更快做对了。"
乍一听反直觉——强模型不是更贵吗?想一下就明白了。模型不够强,问一个问题给个不够好的回答,你得追问、修正、重试。反复几轮下来,调用次数多了,总成本反而更高。再加上隐形成本:时间浪费、用户耐心消耗、错误决策的代价。
性价比的前提是性能。 性能不够,省的不是钱,是给自己挖坑。
他还说了个很务实的话:较小模型如果做到和较大模型比肩的性能,再加上强鲁棒性,比长程fancy task的提升更实用。多数用户场景需要的不是AI一次搞定一件超级复杂的大事,而是每次回答都对、稳定、不出底线错误。
这里我理解,"综合运动会"的比喻不是说每块金牌都无所谓——模型性能这一项,腾讯同样认为是地基,是必须守住的下限。要怎么做到性能够强、成本够合理,是腾讯的长项,移动互联网时代验证过的事,AI时代还会继续。
Agent是体系,不是工具
姚顺雨是ReAct的提出者。2022年7月,他第一次把AI和互联网连在一起——让AI可以在推理的同时调用外部工具。今天所有Agent的底层逻辑都来自这个框架。
但他对Agent的看法比大多数人冷静。几个要点:
Coding Agent是基础能力——编程是图灵完备的,理论上一个足够强的编程Agent可以做任何计算任务。它不是产品方向,是基础设施。
Agent需要体系化——单个Agent再强也只是工具,Agent之间怎么协作、怎么分工,这才是体系。
产品要回流——Agent做的事要有反馈回到产品中形成闭环,跑完一次就完了那不叫Agent,那叫脚本。
需要更多想象力——今天的Agent可能只是70年代的终端机,真正的PC还没出现。
竞争不是谁更复杂谁赢,是谁模型更强、场景更丰富谁赢。 又回到了前面说的——模型能力和场景联接,缺一不可。
我的判断
把几条线索串起来:
一个核心判断——AI是多元版图不是单赛道。腾讯不追单点第一,做均衡布局。
一套方法论——Co-Design,模型和产品一起设计,不是先做模型再找场景。
三个能力——场景联接、工程驾驭、模型驱动。
一个价值取向——性价比的前提是性能,鲁棒性比fancy更有价值。
这不是"追赶型"战略——别人做什么我也做什么。这是"定义型"战略——AI的价值在哪里,我怎么定义问题和场景。
写432那篇时我说便宜到几乎不需要精确估值。写6月2号那篇时说腾讯有底牌有潜力且市场有期待。现在看完这场对话,我想说:腾讯AI的打法本身——这套方法论、这三个能力——代表了腾讯在AI领域的发展下限不会低,上限充满想象。
但有一点要说:AI时代变化快,新赛道上随时会冒出黑马。不过对于原有的千里马来说,只要战略方向对、执行力在,大概率还是强者恒强。
这仅仅是我个人的理解和观点,完全存在因个人经历/认知等限制而导致的观点的片面性或者错误,仅供大家参考,欢迎交流讨论。
我是一个喜欢AI的价值投资者,欢迎和大家一起学习交流。关注后回复"腾讯"即可获取前期深度分析的腾讯分析数据。
📎 错过前两篇?
《腾讯跌到432块,我翻了一遍它的底牌》:https://mp.weixin.qq.com/s/v8LnjZ2jMZ2v6msGjlmn0g[1] 《432到460:腾讯那张AI底牌,还没翻完》(可查阅公众号历史文章)
以上均为个人分析,不构成投资建议。腾讯AI的执行节奏可能慢于预期,市场竞争格局可能快速变化,微信AI Agent的落地时间和商业模式存在不确定性。投资有风险,入市需谨慎。
引用链接
[1]https://mp.weixin.qq.com/s/v8LnjZ2jMZ2v6msGjlmn0g
夜雨聆风