上一期我们讲了2020年。
GPT-3。1750亿参数。人类评估员对AI生成文章的判断准确率只有52%,几乎等于瞎猜。它证明了一件事:当一个足够大的模型在足够多的数据上训练足够长的时间,它会展现出你从未设计过、从未预期过的能力。
那一期结尾我说:下一期,我们讲2022年11月30日。一个叫ChatGPT的产品上线了。两个月内,用户突破1亿。史上增长最快的消费级产品。
今天的故事,是这个系列里最反直觉的一章。
因为ChatGPT不是当时最强的AI模型。它甚至不是GPT-3——它基于GPT-3.5,一个被刻意降级的版本。它的技术不是最新的,它的参数不是最多的,它的能力不是最强的。
但它做对了一件事:它把AI装进了一个聊天框里。
从此,AI不再是论文里的数字。它变成了你每天打开的那个对话窗口。
2022年11月30日:一篇六句话的公告
2022年11月30日,OpenAI在官网上发布了一篇极其简短的产品公告。
没有发布会。没有行业大会。没有媒体吹风会。没有提前泄露的风声。
只有六句话。
大意是:我们做了一个叫ChatGPT的东西,它是一个能够以对话方式进行交互的模型。你可以跟它聊天。它能承认错误。它能挑战不正确的前提。它能拒绝不当请求。
就这样。
当时全球金融市场的目光都聚焦在通胀和加息上。2022年秋天,标普500指数较年初高点下跌了25%,正处于后金融危机以来最糟糕的环境中。英伟达和Meta在2022年一度暴跌近70%,亚马逊股价腰斩。科技股是风暴中心。
没有人注意到OpenAI发了一则六句话的公告。
但就是这则看似简单的公告,意外地为深陷裁员潮和高通胀泥潭的市场与经济提供了转机。它不仅催生了新一轮技术繁荣,更成为了扭转市场情绪的关键催化剂。
5天,100万用户
ChatGPT上线后的第一周,发生了一件让所有人都没有预料到的事。
5天之内,用户突破100万。
OpenAI CEO山姆·奥特曼(Sam Altman)在推特上自豪地表示:与其他在线服务相比,ChatGPT是最快突破百万用户的服务。
人们开始通宵熬夜和它对话聊天。不是为了工作,不是为了学习,纯粹是好奇——这个AI到底能做什么?它的边界在哪里?
一试之下,所有人都震惊了。
它能聊天、写代码、修改bug、做智能音箱、写神经网络……几乎无所不能。你问它"写一首关于秋天的诗",它写出来了。你让它"用小学生能听懂的话解释什么是人工智能",它解释得清清楚楚。你追问"能不能举一个生活中的例子",它继续回答。你再追问"这个例子和机器学习有什么关系",它还是能接住。
这种体验,在2022年11月之前,没有任何产品给过任何人。
2个月,1亿用户:史上增长最快的消费级应用
如果5天100万只是"火爆",那接下来的数字就是"疯狂"。
2023年1月底,ChatGPT月活用户突破1亿。
瑞银集团的一份报告显示,1月期间ChatGPT平均每天大约有1300万独立访客,这一数据是2022年12月的两倍。瑞银分析师在报告中感叹:"在互联网过去20年的发展中,我们找不到哪款消费级互联网应用的用户增长速度比ChatGPT更快。"
来做一组对比:
| ChatGPT | 2个月 |
ChatGPT比TikTok快4.5倍。比Instagram快15倍。比Facebook快27倍。
World of Engineering整理的这份"达到全球1亿用户所用时间"排名,ChatGPT高居榜首,且断崖式领先。
有人清醒地指出:"会有多少人继续使用ChatGPT呢?用户的留存才是真正的问题。"但无论如何,ChatGPT在用户数量增长方面达到了前所未有的高度。
两个月。一亿用户。人类历史上第一次出现这种用户爆炸式增长的产品。
它不是最强的——这才是最疯狂的部分
现在到了这个故事最反直觉的部分。
ChatGPT不是当时最强的AI模型。
它基于GPT-3.5,而不是GPT-3的完整版,更不是后来的GPT-4。OpenAI在发布ChatGPT时,故意对它进行了限制——它比GPT-3弱。它的回答更保守,更谨慎,更不"放飞自我"。
如果你把GPT-3比作一辆没有刹车的跑车——跑得快,但随时可能翻车——那ChatGPT就是同一辆车装上了刹车、限速器和安全气囊。它变慢了,变"笨"了,但也变安全了。
然后,这个"降级版"的AI,成了人类历史上增长最快的产品。
为什么?
因为它做对了三件事。
第一件事:把AI装进聊天框
在ChatGPT之前,使用AI需要门槛。
你需要理解接口。你需要懂参数。你需要知道API怎么调用。你需要会写提示词。甚至你需要懂一点代码。
GPT-3很强大,但它的主要使用方式是通过API——开发者调用接口,嵌入到自己的应用里。普通人想用?对不起,你得先注册开发者账号,读完技术文档,搞清楚prompt engineering的基本规则。
ChatGPT做了一件简单到令人难以置信的事:它把AI塞进了一个聊天框。
你不需要懂任何技术。你打开网页,输入一句话,它就回答你。就像和一个朋友发微信一样自然。
OpenAI在最初的介绍里强调这种对话格式的价值:可以追问、可以纠错、可以承认错误、也能拒绝不当请求。它把大模型从研究系统变成了可被大众直接体验的产品。
这不是技术突破。这是产品突破。
一个老生常谈的科技真理再次被验证:真正改变世界的技术,从来不是最强的技术,而是最容易用的技术。PC的普及不是因为处理器最快,而是因为Windows让操作变简单了。智能手机的普及不是因为芯片最强,而是因为iPhone让触控变直觉了。
ChatGPT的普及不是因为模型最强,而是因为它让AI变"聊天"了。
第二件事:三个"笨技术"组合拳
ChatGPT背后的技术不是什么全新发明。它用了三个已经存在、但从未被如此有效组合的技术。
第一个:代码预训练。
ChatGPT不仅"读"了海量文本,还"啃"了大量代码。代码的严谨逻辑像给AI装了"推理引擎",让它能像人一样"分步思考"——比如解数学题时会生成中间步骤。
这个细节非常重要。因为GPT-3在数学和逻辑推理上的表现一直很差。但当训练数据中加入了大量代码之后,模型学会了"一步一步来"的思维方式。代码本身就是一种严格的逻辑语言——if-then-else、for循环、函数调用——这些结构迫使模型学会分步推理。
第二个:指令微调(Instruction Fine-tuning)。
用人类编写的"任务指令+答案"训练模型,相当于给AI上了堂"举一反三课"。不管用户问"写首诗"还是"总结报告",它都能快速理解意图。
在GPT-3时代,你需要精心设计prompt才能让模型做对事情。ChatGPT不需要。你用日常语言跟它说"帮我写一封辞职信",它就写。你说"用更正式的语气改一下",它就改。
第三个:人类反馈强化学习(RLHF)。
这是ChatGPT最核心的"秘密武器"。
方法是这样的:让人工标注员与模型对话,然后对模型的回答进行评分——哪个回答更好?哪个更准确?哪个更符合人类的期望?用这些评分训练一个"奖励模型",再用这个模型优化AI的生成过程。
简单说,就是"用户喜欢什么,AI就多生成什么"。
RLHF还让ChatGPT学会了拒绝——面对暴力、虚假等不当请求,它能识别并拒绝回答。面对敏感问题,它会给出理由,让人更容易接受。
这三个技术单独拿出来,没有一个是新的。但当它们被组合在一起,并在海量数据上训练到足够大的规模——奇迹发生了。
第三件事:它会"说人话"
ChatGPT最让人上瘾的能力,不是它知道多少,而是它说话的方式。
它能记住对话上下文,像真人一样接话。
你可以先问"什么是人工智能?",它给你一个定义。然后你追问"能不能用小学生能听懂的话解释?",它立刻切换到通俗模式。你再追问"能不能举一个生活中的例子?",它马上给你一个具体的场景。
它能承认错误。
这一点看似普通,实际上在2022年之前几乎没有任何AI系统能做到。传统AI的最大问题不是不会回答,而是可能用很确定的语气给出错误答案。ChatGPT不一样——当用户指出问题后,它可以说"你说得对,我刚才说错了",然后修正。
它能挑战你的错误前提。
如果你问"为什么电脑越清理注册表就越快?",它不会顺着你的话编答案。它会先指出:这个前提可能不成立,注册表清理并不是提升系统性能的通用方案。
它能拒绝不当请求。
你让它教你做危险的事,它拒绝。你让它生成违法内容,它拒绝。而且它会告诉你为什么拒绝。
这些能力加在一起,让ChatGPT不像一个"机器",更像一个"人"。
而一旦AI开始像人,它就不再是一个工具了。它变成了一个"对话伙伴"。
"iPhone时刻":一个改变认知的比喻
ChatGPT发布后,业界给它起了一个名字:AI的"iPhone时刻"。
这个比喻精准得可怕。
iPhone在2007年发布时,它不是第一款智能手机。黑莓、Palm、诺基亚都有智能手机。iPhone的硬件参数也不是最强的——没有物理键盘、没有复制粘贴、没有3G。
但iPhone做对了一件事:它把复杂的技术变成了直觉的体验。
你不需要学怎么用。你用手指点一下就行。
ChatGPT做的是同一件事。它不是第一个大语言模型。GPT-3比它参数更多。BERT比它双向理解更强。但ChatGPT把所有复杂的技术封装进了一个聊天框——你不需要懂Transformer,不需要懂注意力机制,不需要懂RLHF。
你只需要打字。
比尔·盖茨盛赞ChatGPT的意义堪比个人电脑和互联网的诞生。OpenAI联合创始人埃隆·马斯克公开称"ChatGPT好得吓人"。三六零集团创始人周鸿祎甚至认为"ChatGPT是通用AI发展的奇点和强AI即将到来的拐点"。
这些评价不是因为ChatGPT技术最强。而是因为它让所有人都看到了AI的可能性。
从专业工具到大众入口
ChatGPT之前,AI是专业人士的玩具。
研究者用它写论文。工程师用它调代码。企业用它做数据分析。普通人?普通人觉得AI离自己很远——不会写代码,不懂模型参数,不知道API怎么调用。
ChatGPT之后,AI变成了人人都能用的东西。
科大讯飞副总裁刘聪这样总结ChatGPT的能力突破:
"ChatGPT通过至少五个维度能力的显著提升,实现了初步的'智慧涌现':(1)海量高价值信息的全量在线记忆能力;(2)自然语言输入的任意任务和多轮对话理解能力;(3)复杂逻辑的思维链推理能力;(4)多角色多风格的长文本生成表达能力;(5)即时新知识学习应用与进化能力。"
清华大学人工智能国际治理研究院梁正教授这样描述ChatGPT的意义:
"ChatGPT的横空出世,不仅是对新一代聊天机器人和生成式AI的突破,还将对AI产业乃至各行业数智化转型升级带来颠覆性变革。"
ChatGPT改变的不只是"谁在用AI"。它改变了"AI能做什么"。
一个知乎用户总结了ChatGPT带来的三层变化:
这三层变化叠加在一起,意味着AI从"专业工具"变成了"大众入口"。
封杀潮:当世界还没准备好
ChatGPT的火爆速度之快,让整个世界措手不及。
最先反应过来的是教育界。
美国一些教育机构由于担心AI工具会破坏教育,已经在其网络和设备上阻止对ChatGPT的访问。理由很直接:学生可以用ChatGPT写作业、写论文、甚至通过考试。
然后是学术界。
国际机器学习会议ICML禁止征稿使用大型语言模型生成的论文。Nature明文规定ChatGPT等大模型不可以成为作者。arXiv正式规定预印本不允许以ChatGPT等工具为作者。
再然后是技术社区。
Stack Overflow——全球最大的程序员问答社区——封禁了ChatGPT生成的答案。理由是:"虽然ChatGPT产生的答案错误率很高,但我们很难看出来它哪里错了。这会造成问题回答鱼目混珠的情况。"
奥特曼对此承认:"我们正在试图阻止ChatGPT随机编造,现阶段让其与当前技术保持平衡是很棘手的。"
但封杀没有用。
一系列封禁措施,也没能阻挡ChatGPT势如破竹的势头。就像你无法用手指堵住大坝的裂缝——水已经找到了出路。
硅谷的恐慌:谷歌拉响红色警报
ChatGPT的爆火,在硅谷引发了一场地震。
谷歌是震感最强的地方。
2023年开年,微软向OpenAI洽谈投资100亿美元。微软宣布计划将ChatGPT整合进必应搜索——直接针对用户的一些搜索进行个性化回答。这一决定让谷歌压力倍增。
过去一个月里,谷歌创始人拉里·佩奇、谢尔盖·布林与公司高管一直在开会,讨论如何应对。两位已经半退休的创始人被紧急召回。谷歌合并了两大顶级人工智能团队,拉响红色警报。有报道称谷歌即将发布新的AI产品,旨在实现与ChatGPT类似的功能。
谷歌慌了。因为ChatGPT直接威胁到了它的核心业务——搜索。
想象一下这个场景:过去你在谷歌搜索"法国的首都是哪里",你会看到一堆链接。你需要点开链接,自己找到答案。现在,你直接在ChatGPT里问,它直接告诉你"巴黎"。不需要搜索。
科大讯飞刘聪指出:
"以搜索为例,传统搜索引擎根据关键字匹配内容,使用者需要在海量搜索结果中筛选出有用信息,而ChatGPT加持的必应直接给出答案,并提高了问题与答案的匹配精准度,大大提升用户体验。信息分发获取模式的改变将影响流量的分布,并改变流量变现的商业模式。"
搜索引擎的逻辑是"给你一堆链接,你自己找"。ChatGPT的逻辑是"直接给你答案"。
这个差异看似微小,但它可能摧毁一个价值万亿美元的商业模式。
股市狂飙:英伟达979%
ChatGPT不仅改变了科技行业,还改变了金融市场。
自ChatGPT发布以来,由人工智能概念驱动的涨势已推动标普500指数上涨64%。其中大部分增长由少数科技巨头贡献。
英伟达股价在此期间飙升979%,成为最耀眼的赢家。原因很简单:所有做大模型训练的公司都需要英伟达的GPU芯片。ChatGPT越火,英伟达的芯片卖得越多。
由英伟达、微软、苹果、Alphabet、亚马逊、Meta和博通共同组成的七家科技巨头,其集体增长贡献了标普500指数近一半的涨幅。这七家公司的市值权重从三年前的约20%飙升至35%。
OpenAI自身的估值也从发布前的140亿美元暴涨至5000亿美元,跻身全球市值最高的公司行列。
ChatGPT的问世恰逢全球金融市场处于自金融危机以来最糟糕的环境之一。它在最黑暗的时刻出现,把投资者的目光从宏观经济的阴霾引向了技术创新的光明前景。
一个六句话的产品公告,催生了一场万亿美元的资本盛宴。
ChatGPT的"硬伤":它也会一本正经地胡说八道
但ChatGPT不是完美的。它有四个明显的"硬伤"。
第一,逻辑"短路"。
遇到数学题、逻辑推理题,它常给出错误答案。因为它"学"的是概率,不是精确计算。你问它"3+5×2等于几",它可能算错。
第二,事实"翻车"。
它容易"胡编乱造"。你问它"谁写了某篇论文",它可能把作者张冠李戴。而且它说得非常自信——你根本看不出来它在瞎说。
第三,知识"过时"。
它的知识截止到训练数据的时间点,无法实时更新。你问它最新的新闻,它答不上来。
第四,容易"被带偏"。
如果用户用特定话术诱导,它可能突破安全限制,生成不当内容。
这四个问题在2022年底就已经暴露。到2026年的今天,它们仍然没有被彻底解决——只是程度减轻了。
ChatGPT最大的危险不是它会犯错,而是它犯错的方式:它用极其自信的语气说出完全错误的话。你分不清它什么时候在说真话,什么时候在胡说。
一个人的判断:奥特曼为什么赌ChatGPT
这个故事还有一个幕后细节值得讲。
ChatGPT不是OpenAI科学家们想做的产品。
在GPT-3发布之后,OpenAI内部的主流意见是继续做大模型——把参数从1750亿扩大到1万亿,追求更强的学术基准。科学家们对"做一个聊天机器人"没有兴趣。
是奥特曼力排众议,坚持推出ChatGPT。
他懂得规模、流量、用户喜爱度和传播口碑的重要性。他知道,尖端技术如果只停留在论文里,就永远只是尖端技术。只有把它和最广泛的用户连接到一起,才能产生真正的化学反应。
结果,ChatGPT在13天内问世,并迅速震惊世界。
奥特曼做了一个所有人都不看好的决定,然后证明了所有人都是错的。
微软"太上皇"比尔·盖茨也转变了态度。他此前对OpenAI持保留意见,但ChatGPT的爆发让他彻底改观。盖茨称赞ChatGPT的历史意义不亚于互联网的诞生,并宣布微软再投资OpenAI 100亿美元。
从聊天到"AI操作系统":ChatGPT开启的三条路线
ChatGPT上线三年后,它引发的连锁反应仍在加速。
第一条路线:从聊天到Agent。
ChatGPT最初的形态是"问答"——你问它答。但到了2023年3月,OpenAI开始为ChatGPT引入插件体系,让模型能够调用外部工具。2024年,Operator Agent发布,AI能够自主执行网页任务。到2025年,GPT-5.2被定位为面向"专业工作与长程Agent"的模型。
ChatGPT从"回答问题的工具"正在变成"替人做事的操作系统"。
第二条路线:从文本到全模态。
2023年9月,ChatGPT获得了语音和图像能力。2024年5月,GPT-4o把语音、视觉、文本统一到同一个模型中。ChatGPT不再是"打字机器人",它能看、能听、能说。
第三条路线:从单一对话到平台生态。
2023年11月,OpenAI推出GPTs,允许用户创建定制版ChatGPT。2024年1月,GPT Store上线。ChatGPT开始像"应用商店"一样生长——你不只消费它,也开始生产"在它上面运行的东西"。
这三条路线合在一起,指向同一个终局:AI不再是一个聊天窗口,而是一个新的计算平台。
有人把今天的AI比作1995年的互联网。那时TCP/IP协议已经成熟,但普通人进入互联网仍需面对枯燥的指令——直到Windows 95出现,用图形化界面封装了底层技术的复杂性。ChatGPT就是AI的"Windows 95"——它封装了大模型的复杂性,让普通人用自然语言就能触达AI的全部能力。
2022年的遗产
2022年11月30日留给了我们什么?
第一,产品力比技术力更重要。ChatGPT不是最强的AI,但它是最成功的AI产品。这个事实改变了整个行业对"什么才是突破"的认知。从ChatGPT开始,AI公司不再只比拼模型分数,也开始比拼用户体验、产品设计、交互直觉。
第二,自然语言成为人机交互的新界面。在ChatGPT之前,人机交互依赖图形界面——按钮、菜单、表单。ChatGPT之后,自然语言成为一种新的"操作系统"。你不再需要学习软件怎么用,你只需要说出你想要什么。这个转变的深远程度,可能要到十年后才能完全看清。
第三,AI不再是未来的概念,它已经是当下的现实。在ChatGPT之前,普通大众对AI的认知停留在AlphaGo下围棋、自动驾驶、智能音箱——都是"别人的事"。ChatGPT之后,AI变成了"你每天都在用的东西"。这个认知转变是不可逆的。
第四,AI的商业化路径第一次被验证。ChatGPT Plus以20美元/月的定价上线。微软向OpenAI投资100亿美元。谷歌、Meta、百度纷纷入局。一个价值数千亿美元的新产业在ChatGPT上线后的六个月内被催生。
2022年11月30日。一个基于GPT-3.5的聊天机器人上线了。它不是最强的。它不是最新的。它甚至不是OpenAI最想做的产品。但它做对了一件事——它把AI放到了每一个人的手上。从此以后,AI不再是论文里的数字、实验室里的demo、技术博客里的参数。它变成了你每天打开的那个对话窗口。一个聊天框。改变了世界。
下一期,我们讲2023年3月14日。
GPT-4发布了。多模态——不仅能处理文字,还能理解图片。在律师资格考试中击败了90%的人类考生。
但真正的故事不是GPT-4有多强。真正的故事是:在同一个月,谷歌发布了自己的AI产品Bard。在发布会上,Bard犯了一个事实性错误。谷歌市值一天蒸发1000亿美元。
AI军备竞赛的残酷真相:你不是在和对手比谁更好,你是在和对手比谁不犯错。
AI会越来越强,但清醒的人永远稀缺。
这里是「AI清醒局」,我们下期见。
这是「AI编年史」系列的第七期。
从2012年到2026年,每周一个改变AI历史的关键时刻。
如果你想看清AI的过去,才能看清AI的未来。「关注」是最简单的方式。
如果这个"两个月一亿用户"的故事让你觉得花得值,一个「赞」让我知道该继续写下去。
夜雨聆风