大模型超级APP应该怎么设计?

作者：Mark（微信：maxiaoxi2013）

出品：AI星际工厂（ID：AIredplan）

头图：大模型图片

主持人：各位现场以及线上的观众朋友们，欢迎参与AI星际工厂的空中播客。当下大模型技术快速迭代，各大科技企业纷纷布局AI超级APP。今天我们特别邀请到谷歌Gemini业务负责人、腾讯混元&元宝产品负责人，围绕大模型超级APP设计、产品形态、商业模式、行业竞争与未来趋势展开深度对话。首先欢迎两位嘉宾！

第一环节：企业整体AI战略与模型生态布局

主持人：首先想请教两位嘉宾，目前行业内头部企业都在全力推进大模型与全系产品、商业体系的深度融合，能否先分别介绍一下贵公司整体的AI发展战略。

Gemini业务负责人：长期以来，整个行业都在等待高性能、成熟的大模型落地，以此撬动全平台产品的AI升级，如今模型能力已经完全达到商用与全场景落地标准，我们集团也正式进入AI全面融合落地阶段。谷歌将收拢集团所有AI科研力量，让其成为整个集团的技术核心引擎，实现所有AI技术统一迭代、同步落地。目前我们所有AI能力会同步赋能搜索、办公、终端设备、视频、浏览器等全产品线，技术整体迭代效率得到了大幅提升。

在战略协同层面，我每天都会和谷歌CEO同步整体战略规划，一方面聚焦短期产品落地，另一方面兼顾长期AGI安全研发，持续优化整体技术迭代节奏。依托谷歌完整的产品生态、自研TPU算力以及成熟的全品类产品体系。现阶段我们的核心动作，是全面将Gemini大模型融入集团各大核心产品，打造面向全体用户的通用AI助手，深度挖掘大模型在全场景中的落地价值。

同时我们也在持续拓展硬件端布局，积极推进生态合作，目前已经和三星等企业达成深度合作，把Gemini模型落地到智能手机、智能眼镜等各类智能终端设备上。在我们看来，未来通用AI助手一定会成为智能硬件的核心刚需，也会彻底改变大众日常的生活与使用习惯。我们的核心目标很明确：以顶尖大模型为底层基座，驱动全产品AI升级，依托算力、生态、技术三重优势，构建覆盖软件、硬件、服务的完整AI体系。

主持人：感谢您的分享，能看出谷歌是以模型为核心引擎，推动全集团产品一体化升级。接下来请腾讯混元&元宝产品负责人，介绍腾讯这边的整体AI战略与布局思路。

腾讯混元&元宝产品负责人：和行业头部企业思路一致，我们同样认为当下是AI Chatbot以及大模型应用发展的关键窗口期，友商在持续推进产品与用户增长，腾讯也在紧抓机遇稳步布局。我们的核心任务，就是在未来两年内建立起用户心智，打造具备腾讯特色的AI产品。

从组织架构与业务整合来看，公司已经将浏览器、搜狗、输入法等各类工具类产品统一划归到CSIG体系之下，核心逻辑就是重视场景价值。我们坚持将AI能力内嵌到原有成熟产品与用户高频场景当中，比如微信、腾讯会议等国民级产品，让大模型能力自然融入用户日常使用流程，而非单独打造孤立的AI产品。

在模型与产品的协作分工上，腾讯混元大模型和元宝AI产品形成了一套成熟的协同模式：混元团队按照自身技术节奏持续迭代模型版本，每一个新版本都会沉淀元宝产品所需的各类AI能力；元宝则基于混元的稳定版本开展产品设计、交互优化、场景落地等工作，并定期完成模型版本升级。二者相辅相成、双向赋能：元宝的用户场景不断丰富、产品体量持续扩大，能够为混元大模型提供更多落地场景，让模型能力得到充分发挥；而混元大模型的技术实力持续增强，也是元宝优化用户体验、拓展功能边界的核心基础。

我们不会刻意追求打造类似微信这样具备强网络效应的超级社交产品格局。微信依托社交根基形成了独有的行业壁垒，但AI Chatbot这类产品本质以个人服务为主，用户选择更加多元化，不同产品可以找准自身定位、服务对应目标用户。所以元宝不会追求大一统的市场格局，而是立足腾讯内容、服务生态积累，走出差异化路线。

主持人：两位都提到了模型与产品、生态的结合，Meta此前也提出要打造双向赋能的智能体生态，打通供需两端，重构商业逻辑。结合两家企业的生态特点，你们如何看待“AI智能体生态”的构建？

Gemini业务负责人：Meta拥有数十亿个人用户与数百万中小企业商户，愿景是打造高性能AI个人智能体，这一思路和我们不谋而合。AI智能体的核心价值就是打通不同产品、不同服务、不同用户群体之间的壁垒。我们布局智能体生态，一方面是为C端用户打造一站式通用AI助手，简化信息获取、日常办公、娱乐交互等操作；另一方面，依托智能体能力赋能B端客户，提升企业办公、运营、服务的整体效率。

智能体不是单一功能工具，而是贯穿全产品线的底层能力。从搜索到办公，从桌面端到移动端，从软件服务到硬件终端，智能体将作为统一载体，让Gemini的能力实现无缝流转。未来智能体生态比拼的不只是模型本身的智力水平，还有生态的完整度、服务的覆盖广度以及多端协同的流畅度。

腾讯混元&元宝产品负责人：腾讯的生态核心优势集中在内容、社交、生活服务三大板块，微信公众号、视频号更是国内体量最大的公开内容阵地之一，这也是我们构建智能体生态的核心依托。在我们的产品逻辑中，智能体（Agent）从来都不是独立存在的，它需要大量周边能力配套支撑，包括搜索能力、语音理解与生成能力、专业数据能力以及完整的服务生态。而腾讯多年积累的内容生态、服务生态，恰好能补足这些配套能力，这是我们落地智能体的天然优势。

当前行业已经从“先搜索信息，再交由模型解读”的传统模式，转向智能体驱动（Agent-driven）的全新模式：由大模型先理解用户真实意图，再精准检索全网最新、最权威的内容，最后整合梳理输出答案。想要实现这套流程，就离不开检索增强生成（RAG）技术、模型上下文协议（MCP）以及搜索能力的深度配合。我们的元宝产品，正是依托这套逻辑打造，调用微信公众号、视频号等自有内容库完成内容召回，再通过模型理解、加工后输出答案，把生态内容、搜索能力、大模型能力、智能体能力融为一体。

借助MCP协议，我们的智能体还可以外接第三方标准化服务，调取财经、天气、地图等实时数据。毕竟大模型版本迭代周期较长，原生模型无法掌握实时信息，通过智能体调用外部服务，就能完美弥补这一短板。

第二环节：大模型超级APP产品形态与交互设计

主持人：接下来我们聚焦本次论坛的核心主题——大模型超级APP。目前行业内对于超级APP的形态、交互方式争议颇多，有人认为单纯的对话框形态存在局限，也有企业在探索全新交互模式。首先想请问两位，你们如何定义“大模型超级APP”？

Gemini业务负责人：首先明确一点，“超级应用”是我们内部团队沟通时使用的术语，本意并非对外宣传，但这个概念逐渐被行业熟知。在我们的理解中，超级APP就像一座冰山，用户肉眼可见的只是表层的应用界面，其底层核心是一整套统一的智能体基础设施，这也是我们所有布局的根基。

OpenAI的思路也具备参考价值，其将Codex作为超级APP的起步载体，Codex本身是二合一产品：既是通用智能体的载体，同时也是擅长代码开发的智能体。我们认同这一渐进式落地思路，超级APP无法一步成型，必须分阶段迭代、逐步完善。从功能维度来讲，未来的超级APP会具备极强的通用性，整合浏览器、搜索、办公、编程、AI对话等多项能力，最终目标是让用户在一款应用中。

至于产品形态，我们并不认为单一的聊天对话框是终极形态。模型本身具备极强的综合能力，如果仅仅局限于对话框交互，相当于浪费了模型的大部分潜力。现阶段行业普遍使用对话交互，只是技术落地初期的过渡形态。真正的超级APP，需要打破传统交互逻辑，结合不同使用场景设计差异化界面与操作方式。同时我们也看到，未来Web端、独立APP、嵌入式智能体多种形态会长期并存，形态本身不是核心，能否用AI切实放大用户需求、解决实际问题，才是关键。

另外有一点我们也保持清醒：超级APP对于企业而言是一把双刃剑。当企业打造出一款标杆级超级APP后，公司的技术研发、模型训练、组织架构都会围绕这款产品重构，模型研究方向也容易被现有交互方式束缚。所以我们在推进超级APP的同时，也会保证基础模型研究的独立性，不让产品形态限制技术的创新空间。

腾讯混元&元宝产品负责人：国内目前很多聊天机器人产品，都已经具备了超级APP的雏形，但我们同样认为，单纯的Chatbox对话框形态绝对不是终极形态。行业内很多产品经理都有共识：大模型拥有强大的思考、理解、创作、执行能力，可用户却只能通过简单对话框和AI沟通，这种交互方式并没有释放模型的全部价值。

从市场竞争角度来说，如果一款AI产品的交互方式和主流Chatbot高度雷同，就很容易被同类产品替代，没有核心竞争力。所以对于所有参与者而言，全新的交互方式+持续迭代的模型能力，才是突破竞争的核心组合，二者缺一不可。如果只是沿用旧交互，再强的模型也会被头部产品挤压；如果只做新交互，但模型能力停滞不前、没有新的能力溢出，新形态也无法落地。

我们观察到行业内已经出现不少优秀的探索案例：比如Cursor打造了“代码副驾驶”式的全新交互，区别于传统人机对话，在代码编写场景中实现实时提示、协同编辑；还有Canvas产品，能够根据当下任务自动生成适配的前端界面，这类基于具体场景的定制化交互，都是非常有价值的尝试。

结合腾讯元宝的规划，我们不会单纯对标海外产品的形态。一方面，我们会做好基础的对话交互，满足用户问答、咨询等基础需求；另一方面，依托微信、腾讯会议、输入法等现有产品，把AI能力嵌入式落地，在不同场景搭配不同交互形态。同时我们判断，未来两年行业整体还是偏向中心化发展，市场会留存少数几款主流超级APP，每一款都会搭建独有的底层架构、运行环境与交互逻辑。不同企业可以选择不同的产品路线，有人深耕通用型超级APP，有人聚焦垂直场景，也有人打造嵌入式AI能力，多元化形态会长期共存。

主持人：既然传统交互存在局限，那在超级APP的设计与落地过程中，除了模型能力之外，还有哪些关键要素？

Gemini业务负责人：模型是AI产品的“大脑”，但一款合格的超级APP，不能只有大脑，还需要配套的“身体”与“四肢”，也就是完整的交互界面、工具调用能力、多模态能力，让AI能够对接真实世界、完成具体任务。

第一是用户交互界面（GUI）。模型负责信息理解与生成，界面则承担模型和用户之间的信息传递工作，要支持图文、语音、视频等多种形式的收发与交互，友好、流畅、易用的界面，是保障基础体验的前提。

第二是工具整合与调用能力。随着产品逐步走向Agent化，单一模型已经无法满足全部需求，必须整合多模型、调用多元化工具。为此我们搭建了适配Agent开发与运行的AI云原生架构，降低工具调用与智能体开发的门槛。对于企业客户而言，成熟的Agent架构可以大幅降低开发成本，一款定制化智能体甚至能帮助企业节省数千行代码、数周的开发周期。

第三是多模态能力。从AGI的演进逻辑来看，多模态是不可或缺的核心能力。未来AI不仅要能对话、生成文字，还要能处理图片、视频、音频，甚至逐步具备对接物理世界的能力，这也是我们Gemini持续发力的重点。

除此之外，我们还在推进MaaS（模型即服务）体系建设，不断优化模型效果、降低推理成本、提升易用性。一步步简化开发者与用户的使用门槛，让底层能力更好地向上层超级APP赋能。

腾讯混元&元宝产品负责人：我们的设计逻辑，始终围绕场景优先、生态联动、体验落地三大原则展开。首先在交互层面，我们坚持“原生AI搜索”的设计思路。传统搜索引擎是先抓取数据、粗排再精排，而AI原生搜索引擎依托大模型理解用户意图，结合RAG技术完成内容检索、整合、输出，整体效果和体验远优于传统模式，这也是元宝核心的功能底座。

其次是工具与协议的应用。我们全面落地MCP模型上下文协议，通过这套标准化协议，智能体可以灵活调用天气、地图、财经等各类第三方实时服务，弥补大模型无法获取实时信息的短板。同时结合腾讯海量的公众号、视频号内容，形成“自有内容+全网搜索+第三方服务”三位一体的内容与服务体系，解决用户长尾问题、实时问题、专业问题。

在模型与产品的协作边界上，我们做了清晰的划分，实现节奏解耦：混元大模型团队专注基础技术迭代、前沿研究，既要支撑前端产品迭代，也要独立推进技术创新；产品团队则聚焦模型后训练、产品专属微调、系统提示词工程等工作。

第三环节：商业模式、生态合作与行业指标

主持人：技术和产品之外，商业模式决定了大模型超级APP能否长久发展。目前行业内智能体、超级APP催生出了全新的商业逻辑，甚至有观点认为AI智能体将颠覆传统电商、平台经济。请两位谈谈对大模型时代新商业模式的理解。

Gemini业务负责人：AI智能体（Agent）的普及，确实会重构很多传统行业的商业逻辑，首当其冲的就是电商与本地生活服务。传统电商需要用户主动浏览、筛选、对比商品，耗费大量时间；而AI智能体可以记住用户的偏好、需求、消费习惯，主动为用户筛选最优选择，用户不再需要逐一浏览网页，整个购物流程被彻底简化，传统电商的运行逻辑也会被颠覆。

从本质上来说，智能体没有主观欲望，它的唯一目标是帮用户完成任务、找到最优方案，传统互联网依赖的广告营销模式，对智能体基本失效。放眼更远的未来，超级APP整合衣食住行全品类服务后，现有的垂直平台经济模式也可能发生改变。比如出行、家政、金融服务等领域，用户通过个人AI智能体就能完成服务对接、预约、调度，不再需要依赖单一垂直平台。同时，智能体还能自动梳理任务、规划最优流程，大幅提升个人与企业的运转效率，效率落后的参与者会逐步被市场淘汰。

在商业化路径上，谷歌一方面依托Gemini模型做MaaS服务，面向企业、开发者输出模型能力、API服务、智能体开发架构；另一方面依托超级APP与通用AI助手，打通C端增值服务、会员服务、企业办公服务等多元变现路径。同时我们持续推进软硬结合，将模型能力落地到智能硬件，依托硬件终端实现服务变现，形成“模型+软件+硬件+服务”的完整商业闭环。

基础模型的竞争最终只会留存少数头部企业，绝大多数商业机会都会集中在应用层，这也是我们长期坚持的方向。

腾讯混元&元宝产品负责人：我们非常认同智能体将重构商业逻辑这一判断。首先从用户习惯角度来看，AI产品的核心优势是使用门槛低、操作便捷，一旦用户形成使用习惯，就会带来持续的用户增量。举个例子，用户可能既会在传统外卖平台下单，也会习惯通过AI超级APP完成点餐，新旧平台并非完全替代关系，而是共存互补。

腾讯的商业化布局分为两大板块：一是依托自有生态落地场景化服务，将元宝、混元能力融入微信、腾讯会议、内容平台等，依托现有商业体系实现价值转化；二是逐步开放生态合作，对外输出混元大模型能力。

我们也清晰认识到生态合作中的现实问题：用户未必愿意接受“全家桶”式服务，任何企业的生态内产品都无法做到所有品类行业第一，所以我们不会强行捆绑生态服务，而是坚持开放合作、优势互补。电商是我们重点布局的目标场景之一，借助智能体、RAG、搜索能力，优化用户购物、选品、咨询的全流程体验。

主持人：国内企业和海外企业在AI发展路线上存在一定差异，海外侧重AGI探索，国内更偏向场景落地与应用。两位如何看待这种差异？

Gemini业务负责人：海外不少企业将AGI研发比作“曼哈顿计划”，投入巨额资源冲刺通用超级智能，希望在技术层面形成领先优势。谷歌也会持续投入长期技术研究，探索AGI相关技术与安全规范，但我们同样重视落地应用。技术如果无法落地、无法解决具体问题，就只是空中楼阁。

在生态合作上，我们坚持双线并行：对内整合全集团产品，实现AI能力全覆盖；对外积极开展跨品牌、跨行业合作，目前已经和三星等企业合作，将Gemini落地到智能手机、智能眼镜等终端。

同时我们判断，基础模型赛道最终会高度集中，头部少数几家企业掌控核心模型技术，而海量的创新机会、市场机会都在应用层。对于单纯调用模型API的浅度合作，客户忠诚度很低，用户可以随时切换模型；但如果是深度定制，结合私有数据、专属业务逻辑、定制化模型微调，就会形成高壁垒，这也是我们To B服务的核心发力点。

腾讯混元&元宝产品负责人：这是中外AI行业最显著的区别。我们不会盲目追求打造一款“无所不能、适配所有人的超级通用AI”，腾讯的核心思路是聚焦具体问题、落地具体应用。中国最大的优势就是应用场景丰富，海量的实体经济、制造业、互联网场景，只要AI能够有效提升场景效率，就能转化为实实在在的竞争力，同时拉动经济增长。

我们的模型研发，所有目标都是为了解决实际应用问题。即便我们在基础模型的研发投入上，暂时无法对标海外顶级企业，但我们距离应用端更近，更懂本土用户与本土企业的真实需求。

对于企业端赋能，我们内部常态化开展“思研会”，核心议题就是如何帮助内部业务、合作企业内化AI能力。AI的价值不只是赋能个人，更要赋能整个组织、全业务流程。目前企业内化AI主要有三大方向：替代重复性劳动、提升流程效率、创造新增收入，这也是我们对外赋能的核心方向。

第四环节：行业竞争、技术瓶颈与未来趋势预判

主持人：当下大模型行业竞争日趋激烈，有人认为行业会走向高度中心化，少数巨头掌控算力、模型、超级APP；也有人认为AI会像电力一样普及，走向去中心化，赋能每一个个体。两位如何看待中心化与去中心化两种趋势？

Gemini业务负责人：两种趋势会长期并存，不存在绝对的中心化或者绝对的去中心化。首先从中心化角度来看，OpenAI、Anthropic、谷歌这类头部企业，手握顶级算力、顶尖技术、海量资本，有能力打造万亿级别体量的超级公司，掌控核心模型、底层算力与标杆级超级平台，马太效应会持续显现，资源会不断向头部集中，这是由技术研发、算力成本的客观规律决定的。

但与此同时，AI技术也具备去中心化的赋能属性。AI让智能变得像水电一样低成本、易获取，能够抹平人与人之间的信息差、认知差、智能差，赋能普通个体、中小团队与中小企业。

结合短期预判，未来两年行业整体以中心化为主，市场会留存数款主流超级APP，每一款都拥有独立的底层架构、运行环境与交互体系。创业公司可以寻找差异化机会，比如打造全新交互方式、深耕垂直细分场景，依托头部模型能力做应用创新，这也是创业团队最大的机遇。

腾讯混元&元宝产品负责人：我完全认同短期中心化、长期多元共存的判断。未来两年，市场一定会形成少数头部超级APP割据的格局，算力、顶尖模型、流量资源都会向巨头集中，这是短期内无法改变的现状。但机会也同样存在，尤其是对于创业团队和垂直领域玩家。

创业公司的核心破局点，就是我之前提到的：打造全新交互方式，依托模型持续的能力溢出做创新。如果只是复刻现有Chatbot形态，很难在巨头竞争中突围；但如果立足细分场景，设计独有的交互逻辑，结合大模型新能力打造产品，就会获得生存空间。

从产品研发方向上，行业分为两大路线，也都具备广阔空间：第一条路线，基于用户现有的本地数字环境（手机、电脑、现有软件）做能力延伸，把AI嵌入用户已有的使用习惯中；第二条路线，从零打造全新的数字环境，比如深度研究类工具、专属操作型智能体等。这两大方向在未来两年都有巨大的探索空间。

同时我们也清醒认识到行业短板：即便模型能力已经足够强大，但绝大多数企业还没有完全掌握落地应用的方法。模型是核心，但配套的工具链、智能体架构、场景解决方案、合规体系，都是需要全行业共同补齐的短板。

主持人：最后，请两位嘉宾用简短的话语，总结一下对大模型超级APP未来发展的整体展望。

Gemini业务负责人：大模型的技术积累已经迎来爆发节点，超级APP、智能体将成为未来AI落地的核心载体。谷歌会持续以Gemini为技术底座，融合算力、生态、硬件优势，分阶段推进超级应用落地，坚持技术创新与场景落地并行。未来AI不再是单一的对话工具，而是融入工作、生活、娱乐全场景的通用能力，我们也期待和全行业一起，探索AGI与AI应用的更多可能性。

腾讯混元&元宝产品负责人：未来两年是国产AI产品建立用户心智、确立市场定位的黄金窗口期。腾讯会立足本土生态、深耕场景、打磨差异化产品，让混元大模型与元宝产品双向赋能。我们坚持场景优先、应用为王，不盲目追逐概念，专注用AI解决真实问题、创造实际价值。AI超级APP的形态会不断进化，交互、生态、商业模式都会持续突破，本土AI企业也会在应用赛道走出属于自己的道路。

主持人：非常感谢两位嘉宾带来的深度分享，本次对话围绕战略布局、产品形态、商业模式、行业趋势等多个维度，全面解读了大模型超级APP的发展现状与未来方向。本场对话到此结束，再次感谢各位嘉宾与观众！

-END-

加作者微信

关注我们，获取更多深度解读