[AI编年史·07] 2022年,一个不是最强的AI,两个月收割了1亿用户

上一期我们讲了2020年。

GPT-3。1750亿参数。人类评估员对AI生成文章的判断准确率只有52%，几乎等于瞎猜。它证明了一件事：当一个足够大的模型在足够多的数据上训练足够长的时间，它会展现出你从未设计过、从未预期过的能力。

那一期结尾我说：下一期，我们讲2022年11月30日。一个叫ChatGPT的产品上线了。两个月内，用户突破1亿。史上增长最快的消费级产品。

今天的故事，是这个系列里最反直觉的一章。

因为ChatGPT不是当时最强的AI模型。它甚至不是GPT-3——它基于GPT-3.5，一个被刻意降级的版本。它的技术不是最新的，它的参数不是最多的，它的能力不是最强的。

但它做对了一件事：它把AI装进了一个聊天框里。

从此，AI不再是论文里的数字。它变成了你每天打开的那个对话窗口。

2022年11月30日：一篇六句话的公告

2022年11月30日，OpenAI在官网上发布了一篇极其简短的产品公告。

没有发布会。没有行业大会。没有媒体吹风会。没有提前泄露的风声。

只有六句话。

大意是：我们做了一个叫ChatGPT的东西，它是一个能够以对话方式进行交互的模型。你可以跟它聊天。它能承认错误。它能挑战不正确的前提。它能拒绝不当请求。

就这样。

当时全球金融市场的目光都聚焦在通胀和加息上。2022年秋天，标普500指数较年初高点下跌了25%，正处于后金融危机以来最糟糕的环境中。英伟达和Meta在2022年一度暴跌近70%，亚马逊股价腰斩。科技股是风暴中心。

没有人注意到OpenAI发了一则六句话的公告。

但就是这则看似简单的公告，意外地为深陷裁员潮和高通胀泥潭的市场与经济提供了转机。它不仅催生了新一轮技术繁荣，更成为了扭转市场情绪的关键催化剂。

5天，100万用户

ChatGPT上线后的第一周，发生了一件让所有人都没有预料到的事。

5天之内，用户突破100万。

OpenAI CEO山姆·奥特曼（Sam Altman）在推特上自豪地表示：与其他在线服务相比，ChatGPT是最快突破百万用户的服务。

人们开始通宵熬夜和它对话聊天。不是为了工作，不是为了学习，纯粹是好奇——这个AI到底能做什么？它的边界在哪里？

一试之下，所有人都震惊了。

它能聊天、写代码、修改bug、做智能音箱、写神经网络……几乎无所不能。你问它"写一首关于秋天的诗"，它写出来了。你让它"用小学生能听懂的话解释什么是人工智能"，它解释得清清楚楚。你追问"能不能举一个生活中的例子"，它继续回答。你再追问"这个例子和机器学习有什么关系"，它还是能接住。

这种体验，在2022年11月之前，没有任何产品给过任何人。

2个月，1亿用户：史上增长最快的消费级应用

如果5天100万只是"火爆"，那接下来的数字就是"疯狂"。

2023年1月底，ChatGPT月活用户突破1亿。

瑞银集团的一份报告显示，1月期间ChatGPT平均每天大约有1300万独立访客，这一数据是2022年12月的两倍。瑞银分析师在报告中感叹："在互联网过去20年的发展中，我们找不到哪款消费级互联网应用的用户增长速度比ChatGPT更快。"

来做一组对比：

产品	达到1亿用户所用时间
ChatGPT	2个月
TikTok	9个月
Instagram	2年半
WhatsApp	3年半
Facebook	4年半
Twitter	5年
iTunes	6年半

ChatGPT比TikTok快4.5倍。比Instagram快15倍。比Facebook快27倍。

World of Engineering整理的这份"达到全球1亿用户所用时间"排名，ChatGPT高居榜首，且断崖式领先。

有人清醒地指出："会有多少人继续使用ChatGPT呢？用户的留存才是真正的问题。"但无论如何，ChatGPT在用户数量增长方面达到了前所未有的高度。

两个月。一亿用户。人类历史上第一次出现这种用户爆炸式增长的产品。

它不是最强的——这才是最疯狂的部分

现在到了这个故事最反直觉的部分。

ChatGPT不是当时最强的AI模型。

它基于GPT-3.5，而不是GPT-3的完整版，更不是后来的GPT-4。OpenAI在发布ChatGPT时，故意对它进行了限制——它比GPT-3弱。它的回答更保守，更谨慎，更不"放飞自我"。

如果你把GPT-3比作一辆没有刹车的跑车——跑得快，但随时可能翻车——那ChatGPT就是同一辆车装上了刹车、限速器和安全气囊。它变慢了，变"笨"了，但也变安全了。

然后，这个"降级版"的AI，成了人类历史上增长最快的产品。

为什么？

因为它做对了三件事。

第一件事：把AI装进聊天框

在ChatGPT之前，使用AI需要门槛。

你需要理解接口。你需要懂参数。你需要知道API怎么调用。你需要会写提示词。甚至你需要懂一点代码。

GPT-3很强大，但它的主要使用方式是通过API——开发者调用接口，嵌入到自己的应用里。普通人想用？对不起，你得先注册开发者账号，读完技术文档，搞清楚prompt engineering的基本规则。

ChatGPT做了一件简单到令人难以置信的事：它把AI塞进了一个聊天框。

你不需要懂任何技术。你打开网页，输入一句话，它就回答你。就像和一个朋友发微信一样自然。

OpenAI在最初的介绍里强调这种对话格式的价值：可以追问、可以纠错、可以承认错误、也能拒绝不当请求。它把大模型从研究系统变成了可被大众直接体验的产品。

这不是技术突破。这是产品突破。

一个老生常谈的科技真理再次被验证：真正改变世界的技术，从来不是最强的技术，而是最容易用的技术。PC的普及不是因为处理器最快，而是因为Windows让操作变简单了。智能手机的普及不是因为芯片最强，而是因为iPhone让触控变直觉了。

ChatGPT的普及不是因为模型最强，而是因为它让AI变"聊天"了。

第二件事：三个"笨技术"组合拳

ChatGPT背后的技术不是什么全新发明。它用了三个已经存在、但从未被如此有效组合的技术。

第一个：代码预训练。

ChatGPT不仅"读"了海量文本，还"啃"了大量代码。代码的严谨逻辑像给AI装了"推理引擎"，让它能像人一样"分步思考"——比如解数学题时会生成中间步骤。

这个细节非常重要。因为GPT-3在数学和逻辑推理上的表现一直很差。但当训练数据中加入了大量代码之后，模型学会了"一步一步来"的思维方式。代码本身就是一种严格的逻辑语言——if-then-else、for循环、函数调用——这些结构迫使模型学会分步推理。

第二个：指令微调（Instruction Fine-tuning）。

用人类编写的"任务指令+答案"训练模型，相当于给AI上了堂"举一反三课"。不管用户问"写首诗"还是"总结报告"，它都能快速理解意图。

在GPT-3时代，你需要精心设计prompt才能让模型做对事情。ChatGPT不需要。你用日常语言跟它说"帮我写一封辞职信"，它就写。你说"用更正式的语气改一下"，它就改。

第三个：人类反馈强化学习（RLHF）。

这是ChatGPT最核心的"秘密武器"。

方法是这样的：让人工标注员与模型对话，然后对模型的回答进行评分——哪个回答更好？哪个更准确？哪个更符合人类的期望？用这些评分训练一个"奖励模型"，再用这个模型优化AI的生成过程。

简单说，就是"用户喜欢什么，AI就多生成什么"。

RLHF还让ChatGPT学会了拒绝——面对暴力、虚假等不当请求，它能识别并拒绝回答。面对敏感问题，它会给出理由，让人更容易接受。

这三个技术单独拿出来，没有一个是新的。但当它们被组合在一起，并在海量数据上训练到足够大的规模——奇迹发生了。

第三件事：它会"说人话"

ChatGPT最让人上瘾的能力，不是它知道多少，而是它说话的方式。

它能记住对话上下文，像真人一样接话。

你可以先问"什么是人工智能？"，它给你一个定义。然后你追问"能不能用小学生能听懂的话解释？"，它立刻切换到通俗模式。你再追问"能不能举一个生活中的例子？"，它马上给你一个具体的场景。

它能承认错误。

这一点看似普通，实际上在2022年之前几乎没有任何AI系统能做到。传统AI的最大问题不是不会回答，而是可能用很确定的语气给出错误答案。ChatGPT不一样——当用户指出问题后，它可以说"你说得对，我刚才说错了"，然后修正。

它能挑战你的错误前提。

如果你问"为什么电脑越清理注册表就越快？"，它不会顺着你的话编答案。它会先指出：这个前提可能不成立，注册表清理并不是提升系统性能的通用方案。

它能拒绝不当请求。

你让它教你做危险的事，它拒绝。你让它生成违法内容，它拒绝。而且它会告诉你为什么拒绝。

这些能力加在一起，让ChatGPT不像一个"机器"，更像一个"人"。

而一旦AI开始像人，它就不再是一个工具了。它变成了一个"对话伙伴"。

"iPhone时刻"：一个改变认知的比喻

ChatGPT发布后，业界给它起了一个名字：AI的"iPhone时刻"。

这个比喻精准得可怕。

iPhone在2007年发布时，它不是第一款智能手机。黑莓、Palm、诺基亚都有智能手机。iPhone的硬件参数也不是最强的——没有物理键盘、没有复制粘贴、没有3G。

但iPhone做对了一件事：它把复杂的技术变成了直觉的体验。

你不需要学怎么用。你用手指点一下就行。

ChatGPT做的是同一件事。它不是第一个大语言模型。GPT-3比它参数更多。BERT比它双向理解更强。但ChatGPT把所有复杂的技术封装进了一个聊天框——你不需要懂Transformer，不需要懂注意力机制，不需要懂RLHF。

你只需要打字。

比尔·盖茨盛赞ChatGPT的意义堪比个人电脑和互联网的诞生。OpenAI联合创始人埃隆·马斯克公开称"ChatGPT好得吓人"。三六零集团创始人周鸿祎甚至认为"ChatGPT是通用AI发展的奇点和强AI即将到来的拐点"。

这些评价不是因为ChatGPT技术最强。而是因为它让所有人都看到了AI的可能性。

从专业工具到大众入口

ChatGPT之前，AI是专业人士的玩具。

研究者用它写论文。工程师用它调代码。企业用它做数据分析。普通人？普通人觉得AI离自己很远——不会写代码，不懂模型参数，不知道API怎么调用。

ChatGPT之后，AI变成了人人都能用的东西。

科大讯飞副总裁刘聪这样总结ChatGPT的能力突破：

"ChatGPT通过至少五个维度能力的显著提升，实现了初步的'智慧涌现'：(1)海量高价值信息的全量在线记忆能力；(2)自然语言输入的任意任务和多轮对话理解能力；(3)复杂逻辑的思维链推理能力；(4)多角色多风格的长文本生成表达能力；(5)即时新知识学习应用与进化能力。"

清华大学人工智能国际治理研究院梁正教授这样描述ChatGPT的意义：

"ChatGPT的横空出世，不仅是对新一代聊天机器人和生成式AI的突破，还将对AI产业乃至各行业数智化转型升级带来颠覆性变革。"

ChatGPT改变的不只是"谁在用AI"。它改变了"AI能做什么"。

一个知乎用户总结了ChatGPT带来的三层变化：


层级	变化	影响
交互层	从命令式操作变成自然语言对话	使用门槛降低
工作层	从人工独立完成变成人机协作	文档、写作、总结效率提升
认知层	从搜索答案变成持续追问和推理	学习方式发生变化

这三层变化叠加在一起，意味着AI从"专业工具"变成了"大众入口"。

封杀潮：当世界还没准备好

ChatGPT的火爆速度之快，让整个世界措手不及。

最先反应过来的是教育界。

美国一些教育机构由于担心AI工具会破坏教育，已经在其网络和设备上阻止对ChatGPT的访问。理由很直接：学生可以用ChatGPT写作业、写论文、甚至通过考试。

然后是学术界。

国际机器学习会议ICML禁止征稿使用大型语言模型生成的论文。Nature明文规定ChatGPT等大模型不可以成为作者。arXiv正式规定预印本不允许以ChatGPT等工具为作者。

再然后是技术社区。

Stack Overflow——全球最大的程序员问答社区——封禁了ChatGPT生成的答案。理由是："虽然ChatGPT产生的答案错误率很高，但我们很难看出来它哪里错了。这会造成问题回答鱼目混珠的情况。"

奥特曼对此承认："我们正在试图阻止ChatGPT随机编造，现阶段让其与当前技术保持平衡是很棘手的。"

但封杀没有用。

一系列封禁措施，也没能阻挡ChatGPT势如破竹的势头。就像你无法用手指堵住大坝的裂缝——水已经找到了出路。

硅谷的恐慌：谷歌拉响红色警报

ChatGPT的爆火，在硅谷引发了一场地震。

谷歌是震感最强的地方。

2023年开年，微软向OpenAI洽谈投资100亿美元。微软宣布计划将ChatGPT整合进必应搜索——直接针对用户的一些搜索进行个性化回答。这一决定让谷歌压力倍增。

过去一个月里，谷歌创始人拉里·佩奇、谢尔盖·布林与公司高管一直在开会，讨论如何应对。两位已经半退休的创始人被紧急召回。谷歌合并了两大顶级人工智能团队，拉响红色警报。有报道称谷歌即将发布新的AI产品，旨在实现与ChatGPT类似的功能。

谷歌慌了。因为ChatGPT直接威胁到了它的核心业务——搜索。

想象一下这个场景：过去你在谷歌搜索"法国的首都是哪里"，你会看到一堆链接。你需要点开链接，自己找到答案。现在，你直接在ChatGPT里问，它直接告诉你"巴黎"。不需要搜索。

科大讯飞刘聪指出：

"以搜索为例，传统搜索引擎根据关键字匹配内容，使用者需要在海量搜索结果中筛选出有用信息，而ChatGPT加持的必应直接给出答案，并提高了问题与答案的匹配精准度，大大提升用户体验。信息分发获取模式的改变将影响流量的分布，并改变流量变现的商业模式。"

搜索引擎的逻辑是"给你一堆链接，你自己找"。ChatGPT的逻辑是"直接给你答案"。

这个差异看似微小，但它可能摧毁一个价值万亿美元的商业模式。

股市狂飙：英伟达979%

ChatGPT不仅改变了科技行业，还改变了金融市场。

自ChatGPT发布以来，由人工智能概念驱动的涨势已推动标普500指数上涨64%。其中大部分增长由少数科技巨头贡献。

英伟达股价在此期间飙升979%，成为最耀眼的赢家。原因很简单：所有做大模型训练的公司都需要英伟达的GPU芯片。ChatGPT越火，英伟达的芯片卖得越多。

由英伟达、微软、苹果、Alphabet、亚马逊、Meta和博通共同组成的七家科技巨头，其集体增长贡献了标普500指数近一半的涨幅。这七家公司的市值权重从三年前的约20%飙升至35%。

OpenAI自身的估值也从发布前的140亿美元暴涨至5000亿美元，跻身全球市值最高的公司行列。

ChatGPT的问世恰逢全球金融市场处于自金融危机以来最糟糕的环境之一。它在最黑暗的时刻出现，把投资者的目光从宏观经济的阴霾引向了技术创新的光明前景。

一个六句话的产品公告，催生了一场万亿美元的资本盛宴。

ChatGPT的"硬伤"：它也会一本正经地胡说八道

但ChatGPT不是完美的。它有四个明显的"硬伤"。

第一，逻辑"短路"。

遇到数学题、逻辑推理题，它常给出错误答案。因为它"学"的是概率，不是精确计算。你问它"3+5×2等于几"，它可能算错。

第二，事实"翻车"。

它容易"胡编乱造"。你问它"谁写了某篇论文"，它可能把作者张冠李戴。而且它说得非常自信——你根本看不出来它在瞎说。

第三，知识"过时"。

它的知识截止到训练数据的时间点，无法实时更新。你问它最新的新闻，它答不上来。

第四，容易"被带偏"。

如果用户用特定话术诱导，它可能突破安全限制，生成不当内容。

这四个问题在2022年底就已经暴露。到2026年的今天，它们仍然没有被彻底解决——只是程度减轻了。

ChatGPT最大的危险不是它会犯错，而是它犯错的方式：它用极其自信的语气说出完全错误的话。你分不清它什么时候在说真话，什么时候在胡说。

一个人的判断：奥特曼为什么赌ChatGPT

这个故事还有一个幕后细节值得讲。

ChatGPT不是OpenAI科学家们想做的产品。

在GPT-3发布之后，OpenAI内部的主流意见是继续做大模型——把参数从1750亿扩大到1万亿，追求更强的学术基准。科学家们对"做一个聊天机器人"没有兴趣。

是奥特曼力排众议，坚持推出ChatGPT。

他懂得规模、流量、用户喜爱度和传播口碑的重要性。他知道，尖端技术如果只停留在论文里，就永远只是尖端技术。只有把它和最广泛的用户连接到一起，才能产生真正的化学反应。

结果，ChatGPT在13天内问世，并迅速震惊世界。

奥特曼做了一个所有人都不看好的决定，然后证明了所有人都是错的。

微软"太上皇"比尔·盖茨也转变了态度。他此前对OpenAI持保留意见，但ChatGPT的爆发让他彻底改观。盖茨称赞ChatGPT的历史意义不亚于互联网的诞生，并宣布微软再投资OpenAI 100亿美元。

从聊天到"AI操作系统"：ChatGPT开启的三条路线

ChatGPT上线三年后，它引发的连锁反应仍在加速。

第一条路线：从聊天到Agent。

ChatGPT最初的形态是"问答"——你问它答。但到了2023年3月，OpenAI开始为ChatGPT引入插件体系，让模型能够调用外部工具。2024年，Operator Agent发布，AI能够自主执行网页任务。到2025年，GPT-5.2被定位为面向"专业工作与长程Agent"的模型。

ChatGPT从"回答问题的工具"正在变成"替人做事的操作系统"。

第二条路线：从文本到全模态。

2023年9月，ChatGPT获得了语音和图像能力。2024年5月，GPT-4o把语音、视觉、文本统一到同一个模型中。ChatGPT不再是"打字机器人"，它能看、能听、能说。

第三条路线：从单一对话到平台生态。

2023年11月，OpenAI推出GPTs，允许用户创建定制版ChatGPT。2024年1月，GPT Store上线。ChatGPT开始像"应用商店"一样生长——你不只消费它，也开始生产"在它上面运行的东西"。

这三条路线合在一起，指向同一个终局：AI不再是一个聊天窗口，而是一个新的计算平台。

有人把今天的AI比作1995年的互联网。那时TCP/IP协议已经成熟，但普通人进入互联网仍需面对枯燥的指令——直到Windows 95出现，用图形化界面封装了底层技术的复杂性。ChatGPT就是AI的"Windows 95"——它封装了大模型的复杂性，让普通人用自然语言就能触达AI的全部能力。

2022年的遗产

2022年11月30日留给了我们什么？

第一，产品力比技术力更重要。ChatGPT不是最强的AI，但它是最成功的AI产品。这个事实改变了整个行业对"什么才是突破"的认知。从ChatGPT开始，AI公司不再只比拼模型分数，也开始比拼用户体验、产品设计、交互直觉。

第二，自然语言成为人机交互的新界面。在ChatGPT之前，人机交互依赖图形界面——按钮、菜单、表单。ChatGPT之后，自然语言成为一种新的"操作系统"。你不再需要学习软件怎么用，你只需要说出你想要什么。这个转变的深远程度，可能要到十年后才能完全看清。

第三，AI不再是未来的概念，它已经是当下的现实。在ChatGPT之前，普通大众对AI的认知停留在AlphaGo下围棋、自动驾驶、智能音箱——都是"别人的事"。ChatGPT之后，AI变成了"你每天都在用的东西"。这个认知转变是不可逆的。

第四，AI的商业化路径第一次被验证。ChatGPT Plus以20美元/月的定价上线。微软向OpenAI投资100亿美元。谷歌、Meta、百度纷纷入局。一个价值数千亿美元的新产业在ChatGPT上线后的六个月内被催生。

2022年11月30日。一个基于GPT-3.5的聊天机器人上线了。它不是最强的。它不是最新的。它甚至不是OpenAI最想做的产品。但它做对了一件事——它把AI放到了每一个人的手上。从此以后，AI不再是论文里的数字、实验室里的demo、技术博客里的参数。它变成了你每天打开的那个对话窗口。一个聊天框。改变了世界。

下一期，我们讲2023年3月14日。

GPT-4发布了。多模态——不仅能处理文字，还能理解图片。在律师资格考试中击败了90%的人类考生。

但真正的故事不是GPT-4有多强。真正的故事是：在同一个月，谷歌发布了自己的AI产品Bard。在发布会上，Bard犯了一个事实性错误。谷歌市值一天蒸发1000亿美元。

AI军备竞赛的残酷真相：你不是在和对手比谁更好，你是在和对手比谁不犯错。

AI会越来越强，但清醒的人永远稀缺。

这里是「AI清醒局」，我们下期见。

这是「AI编年史」系列的第七期。

从2012年到2026年，每周一个改变AI历史的关键时刻。

如果你想看清AI的过去，才能看清AI的未来。「关注」是最简单的方式。

如果这个"两个月一亿用户"的故事让你觉得花得值，一个「赞」让我知道该继续写下去。