OpenAI 想把两个 App 变成一个,我却嫌四个不够分

昨天刷到 OpenAI 要把 ChatGPT 和 Codex 合体的消息时，我挺惊讶的，感觉OpenAI不走寻常路啊，这和我在用的腾讯系AI完全是两个方向啊。

低头看了一眼自己的桌面——元宝挂着、WorkBuddy 在跑、QClaw 在等指令，另外还有powershell中的Hermes 刚完成一篇推文的消息。四个 AI 工具，四个窗口，各干各的。

有人要把两个 App 变成一个，我却嫌四个还不够分。

一、OpenAI：一把瑞士军刀

这件事具体意味着什么？发布会现场演示了一个场景：对着 Codex 说"最近取消订阅量飙升，查一下怎么回事"，几分钟后生成完整报告；随后改图表样式，再让 Agent 将整份报告转为幻灯片。写 SQL、画图表、做 PPT、建站——全程一个入口，Agent 自主串起来。

ChatGPT 聊方案 + Codex 写代码 + 角色插件覆盖六大岗位 + Sites 自然语言建站 + Annotations 定点批注。一个入口搞定一切，近 10 亿用户直接导流。当然也有有开发者担心专业感被稀释，社区里讨论得挺热闹的。

背后还有一层：驱动这一切的是 GPT-5.5，同质量输出下 token 消耗仅原来的 1/3。智能但足够便宜，才能渗透进每一个工作角落——这是 OpenAI 敢做"一个入口"的技术底气。

二、我的工具箱：腾讯系 + 一个补丁

我自己的桌面，走的是完全相反的路：每个工具只做一件事，各自做到够深。

日常主力是腾讯系——元宝负责日常问答（快，能找到公众号的信息源）、WorkBuddy 管专业深度任务、QClaw 专注于初稿的生成和长流程任务的运行。没有谁取代谁，各管一摊。

腾讯系之外还挂着一个 Hermes——我利用它长记忆、自进化的特性，作为日常使用的不补充。

至于 ChatGPT 和 Codex？受限于国内网络，基本体验不到。OpenAI 发布会上演示的那些场景，对我来说更像是看别人家的事。

这套打法有一个瑞士军刀做不到的事：深度任务的上下文不会互相污染。 WorkBuddy 跑专业审核任务时，它的知识库、审核逻辑、输出格式是封闭的，不被聊天记录或其他任务干扰。这是"一个入口搞定一切"目前解决不好的问题。

三、其他国内大厂在怎么做

用了腾讯系的工具箱，自然会好奇：其他国内大厂到底在怎么布局？

答案挺有意思——没有一家完全走 OpenAI 的"合体"路线，也没有一家完全走"各管一摊"的路线，而是在做入口和做生态之间找平衡。

字节：一个豆包，背后一整张网

字节的策略最接近 OpenAI——全力推豆包一个入口。豆包 DAU 已破亿，集成了对话、写作、图像生成、视频生成（即梦 AI）等能力，用户感知上就是一个 App 搞定大部分事。

但字节没把所有东西都塞进豆包。开发者侧有独立的 TRAE（AI 编程助手）和 Coze（Agent 开发平台），面向企业客户还有 火山引擎 输出大模型能力。做法是：消费端做一个超级入口，开发者/企业端留独立产品。和 OpenAI 把所有东西合并进 ChatGPT 比，字节留了后路。

百度：文心 + 千帆，两条线各跑各的

百度的策略是入口和模型分设，而且跑得最近。

2026 年 5 月，百度在 Create 大会上发布了 文心大模型 5.1，把搜索、知识问答、Agent 能力做了一次集中升级。文心一言瞄准的是普通用户——对标 ChatGPT，集成在百度搜索里，用户门槛极低。

但百度没有把开发者也塞进文心。它同时推 千帆大模型平台，让企业自己搭应用、调模型、管数据。千帆的定位是""企业级一站式大模型开发及应用开发平台"，企业可以在上面选文心，也可以选别的模型。

这套双轨制的好处是商业化盘子铺得开——C 端用户、开发者、企业客户，各有一款产品接。代价也很明显：普通用户根本分不清文心和千帆到底该用哪个，产品矩阵认知是分裂的。

阿里：不做入口，做基础设施

阿里的打法最不按常理出牌。

它没有强推一个独立超级 App，而是把 通义千问 的能力嵌进钉钉的每一个角落。聊天窗口里有 AI 总结，会议里有 AI 纪要，文档里有 AI 写作，群聊里 AI 客服助手能直接回答业务问题。没有一个"超级 App"，但 AI 无处不在。

这套打法的逻辑是：入口不重要，模型能力才是底层的牌。 钉钉可以是入口，淘宝也可以是入口，菜鸟也可以是——但通义千问是同一层能力，往上接什么入口都行。

这和腾讯把 AI 嵌进微信、企业微信是同一个思路，但阿里走得更彻底：连"入口"这个概念都不想争，想争的是"你用什么模型"。

三家做下来，规律挺清晰：国内大厂没有一家敢把所有赌注押在单一入口上，都在给自己留分散的后路——要么消费端/开发者端分开，要么入口/基础设施分层。

四、为什么国内大厂不敢"合体"

合体这件事，听起来简单，做起来有三堵墙。

流量成本是第一堵。 OpenAI 有近 10 亿用户底子，合体是存量整合。国内大厂每一个 AI 新用户都是砸真金白银吸引来的，不敢轻易把两个产品的用户池合并到一个入口里赌——万一用户不适应，两边一起丢。

组织边界是第二堵，而且比产品边界更硬。workbuddy由腾讯云开发，Qclaw由腾讯电脑管家推出，元宝属于技术工程事业群，另外腾讯应用宝团队近期也推出了功能相近的Marvis。做一个超级 App，意味着重新划分 KPI 和预算，这比做产品难多了。OpenAI 没有这个问题，国内大厂几乎都有。

监管是第三堵。 一个 App 汇集用户所有数据和行为，在国内意味着更大的合规压力。分开做，至少数据隔离上清晰一些，说得清楚。

五、真正的答案是什么

说实话，我两边都纠结。

任务跑一半要切工具时，确实想要一个超级 App。但真把一切都塞进去，又怕它变成那个什么都干但什么都不精的东西。

我现在桌面上开着这几个窗口，在各个agent之间切换，其实是有一层隐形成本的——我自己在当调度层。大脑要记住哪个任务在哪个工具里跑，哪个输出要粘贴到下一个工具。OpenAI 想用 Agent 把这个调度层收掉，逻辑上是对的，只是不知道能不能达到该也有的深度。

可能真正的答案是：分做深耕，合做入口。

深耕的事交给专业工具各自做，入口的事交给一个 App 统一接。用户感知的是一个东西，背后跑的是一群 specialist。这事说起来容易，做起来才知道有多难——但 OpenAI 这次合体，明显是在往这个方向走。

还有一个变量值得盯着：入口的争夺，本质上是"谁来调度你的工作流"。OpenAI 把 Codex 装进 ChatGPT，等于把调度权收口到自己这里。国内大厂把调度权留在工作流层（钉钉、微信），比 OpenAI 更分散，但也更灵活。

我的答案很土：先用着，哪个顺手留哪个。架构问题等用出来再解决。