昨天刷到 OpenAI 要把 ChatGPT 和 Codex 合体的消息时,我挺惊讶的,感觉OpenAI不走寻常路啊,这和我在用的腾讯系AI完全是两个方向啊。
低头看了一眼自己的桌面——元宝挂着、WorkBuddy 在跑、QClaw 在等指令,另外还有powershell中的Hermes 刚完成一篇推文的消息。四个 AI 工具,四个窗口,各干各的。
有人要把两个 App 变成一个,我却嫌四个还不够分。
一、OpenAI:一把瑞士军刀
这件事具体意味着什么?发布会现场演示了一个场景:对着 Codex 说"最近取消订阅量飙升,查一下怎么回事",几分钟后生成完整报告;随后改图表样式,再让 Agent 将整份报告转为幻灯片。写 SQL、画图表、做 PPT、建站——全程一个入口,Agent 自主串起来。
ChatGPT 聊方案 + Codex 写代码 + 角色插件覆盖六大岗位 + Sites 自然语言建站 + Annotations 定点批注。一个入口搞定一切,近 10 亿用户直接导流。当然也有有开发者担心专业感被稀释,社区里讨论得挺热闹的。
背后还有一层:驱动这一切的是 GPT-5.5,同质量输出下 token 消耗仅原来的 1/3。智能但足够便宜,才能渗透进每一个工作角落——这是 OpenAI 敢做"一个入口"的技术底气。
二、我的工具箱:腾讯系 + 一个补丁
我自己的桌面,走的是完全相反的路:每个工具只做一件事,各自做到够深。
日常主力是腾讯系——元宝负责日常问答(快,能找到公众号的信息源)、WorkBuddy 管专业深度任务、QClaw 专注于初稿的生成和长流程任务的运行。没有谁取代谁,各管一摊。
腾讯系之外还挂着一个 Hermes——我利用它长记忆、自进化的特性,作为日常使用的不补充。
至于 ChatGPT 和 Codex?受限于国内网络,基本体验不到。OpenAI 发布会上演示的那些场景,对我来说更像是看别人家的事。
这套打法有一个瑞士军刀做不到的事:深度任务的上下文不会互相污染。 WorkBuddy 跑专业审核任务时,它的知识库、审核逻辑、输出格式是封闭的,不被聊天记录或其他任务干扰。这是"一个入口搞定一切"目前解决不好的问题。
三、其他国内大厂在怎么做
用了腾讯系的工具箱,自然会好奇:其他国内大厂到底在怎么布局?
答案挺有意思——没有一家完全走 OpenAI 的"合体"路线,也没有一家完全走"各管一摊"的路线,而是在做入口和做生态之间找平衡。
字节:一个豆包,背后一整张网
字节的策略最接近 OpenAI——全力推豆包一个入口。豆包 DAU 已破亿,集成了对话、写作、图像生成、视频生成(即梦 AI)等能力,用户感知上就是一个 App 搞定大部分事。
但字节没把所有东西都塞进豆包。开发者侧有独立的 TRAE(AI 编程助手)和 Coze(Agent 开发平台),面向企业客户还有 火山引擎 输出大模型能力。做法是:消费端做一个超级入口,开发者/企业端留独立产品。和 OpenAI 把所有东西合并进 ChatGPT 比,字节留了后路。
百度:文心 + 千帆,两条线各跑各的
百度的策略是入口和模型分设,而且跑得最近。
2026 年 5 月,百度在 Create 大会上发布了 文心大模型 5.1,把搜索、知识问答、Agent 能力做了一次集中升级。文心一言瞄准的是普通用户——对标 ChatGPT,集成在百度搜索里,用户门槛极低。
但百度没有把开发者也塞进文心。它同时推 千帆大模型平台,让企业自己搭应用、调模型、管数据。千帆的定位是""企业级一站式大模型开发及应用开发平台",企业可以在上面选文心,也可以选别的模型。
这套双轨制的好处是商业化盘子铺得开——C 端用户、开发者、企业客户,各有一款产品接。代价也很明显:普通用户根本分不清文心和千帆到底该用哪个,产品矩阵认知是分裂的。
阿里:不做入口,做基础设施
阿里的打法最不按常理出牌。
它没有强推一个独立超级 App,而是把 通义千问 的能力嵌进钉钉的每一个角落。聊天窗口里有 AI 总结,会议里有 AI 纪要,文档里有 AI 写作,群聊里 AI 客服助手能直接回答业务问题。没有一个"超级 App",但 AI 无处不在。
这套打法的逻辑是:入口不重要,模型能力才是底层的牌。 钉钉可以是入口,淘宝也可以是入口,菜鸟也可以是——但通义千问是同一层能力,往上接什么入口都行。
这和腾讯把 AI 嵌进微信、企业微信是同一个思路,但阿里走得更彻底:连"入口"这个概念都不想争,想争的是"你用什么模型"。
三家做下来,规律挺清晰:国内大厂没有一家敢把所有赌注押在单一入口上,都在给自己留分散的后路——要么消费端/开发者端分开,要么入口/基础设施分层。
四、为什么国内大厂不敢"合体"
合体这件事,听起来简单,做起来有三堵墙。
流量成本是第一堵。 OpenAI 有近 10 亿用户底子,合体是存量整合。国内大厂每一个 AI 新用户都是砸真金白银吸引来的,不敢轻易把两个产品的用户池合并到一个入口里赌——万一用户不适应,两边一起丢。
组织边界是第二堵,而且比产品边界更硬。workbuddy由腾讯云 开发,Qclaw由腾讯电脑管家推出,元宝属于技术工程事业群,另外腾讯应用宝团队近期也推出了功能相近的Marvis。做一个超级 App,意味着重新划分 KPI 和预算,这比做产品难多了。OpenAI 没有这个问题,国内大厂几乎都有。
监管是第三堵。 一个 App 汇集用户所有数据和行为,在国内意味着更大的合规压力。分开做,至少数据隔离上清晰一些,说得清楚。
五、真正的答案是什么
说实话,我两边都纠结。
任务跑一半要切工具时,确实想要一个超级 App。但真把一切都塞进去,又怕它变成那个什么都干但什么都不精的东西。
我现在桌面上开着这几个窗口,在各个agent之间切换,其实是有一层隐形成本的——我自己在当调度层。大脑要记住哪个任务在哪个工具里跑,哪个输出要粘贴到下一个工具。OpenAI 想用 Agent 把这个调度层收掉,逻辑上是对的,只是不知道能不能达到该也有的深度。
可能真正的答案是:分做深耕,合做入口。
深耕的事交给专业工具各自做,入口的事交给一个 App 统一接。用户感知的是一个东西,背后跑的是一群 specialist。这事说起来容易,做起来才知道有多难——但 OpenAI 这次合体,明显是在往这个方向走。
还有一个变量值得盯着:入口的争夺,本质上是"谁来调度你的工作流"。OpenAI 把 Codex 装进 ChatGPT,等于把调度权收口到自己这里。国内大厂把调度权留在工作流层(钉钉、微信),比 OpenAI 更分散,但也更灵活。
我的答案很土:先用着,哪个顺手留哪个。架构问题等用出来再解决。
夜雨聆风