当 ChatGPT 在 2022 年末上线时,没有人意识到这是一次更年期的互联网进化。五天后它突破了一百万用户,两个月后一亿。历史上没有任何产品增长这么快——比微信快 19 倍,比 TikTok 快 4 倍。但真正的风暴在 2023 年才降临。
2023 年——后来被定义为"AI 大模型元年"的年份。但我想问的是:这一年,你第一次对 AI 说了什么?
一、新物种诞生
2022 年 11 月 30 日,OpenAI 在官网上静悄悄地发布了一个名为"ChatGPT"的对话机器人。
没有发布会,没有预告,甚至没有专门的新闻稿。Sam Altman 后来回忆说:"我们只是觉得它很有趣,想看看人们会不会喜欢。"
五天之内,一百万人试了它。两个月后,月活用户破亿——这个数字,TikTok 用了九个月,Instagram 用了两年半,微信用了一年多。ChatGPT 成了人类历史上增长最快的消费级应用。
但比增长速度更让人不安的是它的体验质量。你在对话框里打字,它像人一样回答你。不是搜索引擎那种"你可能想找"的列表,而是一个有逻辑的、连贯的、甚至有点幽默感的句子。你追问它,它记得上下文。你质疑它,它会道歉然后重新回答。你让它写代码、写诗、写邮件、写商业计划书——它都干得不错。
有人称之为"魔法",有人称之为"幻觉",有人称之为"对搜索引擎的降维打击"。
真正的恐慌发生在 2023 年 3 月 14 日——GPT-4 发布。它的推理能力让所有竞争者绝望:它能通过律师资格考试(成绩排前 10%),通过生物奥林匹克竞赛(排前 1%),能解释梗图,能看懂手写的数学公式。Sam Altman 在推特上只写了一句话:"这是我们迄今为止能力最强的模型。"
这句话的潜台词是:我们自己也不知道它能力的边界在哪。
风暴从美国刮到中国用了不到三个月。2023 年 2 月,国内科技圈陷入了焦灼——每一个会议室里都在讨论同一个问题:"我们的大模型在哪里?"
与此同时,监管也在快跑。2023 年 8 月 15 日,《生成式人工智能服务管理暂行办法》正式施行——这是全球第一部专门针对生成式 AI 的监管法规。中国成为世界上第一个给大模型立规矩的国家。
二、三个人的 2023
李彦宏:迟到者最后的冲刺
对于李彦宏来说,2023 年可能是他职业生涯最难熬的一年。
百度是中国最早布局 AI 的公司。2013 年就成立了深度学习研究院,2017 年喊出"All in AI",2021 年推出文心大模型 1.0。但所有这些积蓄,在 ChatGPT 面前都不够看了——中国用户冲进百度搜索,只是为了问"怎么用 ChatGPT"。百度的股价在 ChatGPT 发布后的两个月里跌去了近三分之一。
2023 年 3 月 16 日,百度在北京总部召开了一场被业内称为"最尴尬的发布会"。文心一言的现场演示频频翻车——回答问题答非所问,生成视频卡顿延迟,股价当场跌了 6%。
李彦宏站在台上,身后的 PPT 上写着"生成式 AI 的划时代产品"。他没有回避尴尬。他说:"我们确实还有很长的路要走。但路,是从第一步开始的。"
后来有人复盘说,那场发布会虽然翻车,但让全中国第一次清晰地看到了差距有多大,以及差距在哪里——不在于算力,不在于数据,而在于底层模型架构的理解。那个意识到差距的瞬间,比任何胜利都重要。
到了 2023 年 10 月,文心大模型 4.0 发布,李彦宏再次登台,这次没有翻车。他说:"百度的 AI 不是在追赶别人,是在追赶自己。"会后有媒体问他这一年最大的感受是什么。他沉默了几秒钟,说:"恐惧。"
王小川:从搜索到搜自己
如果说李彦宏是被 ChatGPT 打得最痛的中国人,王小川可能是反应最快的那一个。
2023 年 4 月,就在 ChatGPT 发布不到五个月后,前搜狗 CEO 王小川宣布创立"百川智能",要做中国最好的大模型。"百川"这个名字来自"海纳百川"——他说大模型不是一个人的事,需要集合世界上最聪明的大脑。
三个月后,百川智能发布了第一代模型 Baichuan-7B。开源、免费、性能排在国产第一梯队。王小川的节奏快得像在打仗——每两三个月发布一个新版本,每次都在拉近与 GPT 的距离。
有人问他为什么这么快。他说了一个故事:2012 年搜狗做输入法移动版的时候,整个团队靠在同一个沙发上睡觉,轮班写代码。"那是我最快乐的时候。"2023 年他又回到了那种状态——凌晨三点给团队发消息,早上七点出现在办公室。53 岁的 CEO,像 23 岁的创业者一样拼。
后来人们发现,王小川把搜狗卖给腾讯之后,财富早已自由。他做百川不是因为钱——是因为不甘心。"我在搜索上错过了一整个时代,不能再错过 AI 了。"他说这句话的时候,语气平静得像在陈述天气预报,但所有人都听出了底下的波澜。
杨植麟:90 后的野望
2023 年 4 月,30 岁的杨植麟在北京注册了"月之暗面"——这个名字来自 Pink Floyd 的专辑《The Dark Side of the Moon》。他是清华 2015 级学生、卡内基梅隆大学博士、曾在 Google 和 Facebook 的 AI 实验室工作。在 AI 圈子里,他被称为"90 后中最懂大模型的人"。
他的启动方式让所有人震惊:在创立公司之前,他在硅谷算了一笔账——如果要做 AGI,启动资金需要 1 亿美金以上。他回去见了十几家投资机构,带去的只有一张白板上的架构图和 90 分钟的讲述。没有 MVP,没有原型,没有商业计划书——只有他对下一代 AI 架构的判断。
最终他拿到了钱,而且拿了很多。
月之暗面成立不到一年,估值超过 200 亿美元。他们的产品 Kimi 以"超长上下文"一战成名——别人处理 2000 个 token 的时候,Kimi 能一口气读完一整本《三体》。杨植麟说:"AI 的能力天花板不在算力,在架构。如果架构对了,一条错误的路也能跑到最前面。"
这个留着长发、组过乐队、写代码时听金属摇滚的年轻人,成了中国大模型浪潮中最被寄予厚望的 90 后创始人之一。
三、百模大战中的众生相
2023 年 8 月 31 日,北京亦庄的百度科技园里,首批通过《生成式人工智能服务管理暂行办法》备案的 8 家大模型正式向公众开放。那天晚上,无数人在手机上下载了"文心一言"的 App,用"你好"敲开了中国 AI 的大门。服务器瞬间被挤爆。
同一天,阿里通义千问开放,腾讯混元开放,科大讯飞星火开放,智谱 AI 的 ChatGLM、百川智能、Minimax、云从科技……一夜之间,中国互联网用户发现自己面对的不是一个大模型,而是一整片新的森林。
周鸿祎这一年彻底变了一个人。这个曾经靠免费杀毒杀出一条血路的"红衣教主",在 2023 年把自己活成了 AI 界的第一网红。他在直播间里一讲 AI 就是两三个小时,不喝水、不停顿,从 GPT-4 的技术原理讲到国内的差距再到未来的应对。有人说他蹭热度,他说:"热度是蹭出来的,但能力不是。我做 360 AI 不是为了蹭 ChatGPT,是为了让中国有一个真正安全的 AI。"
张鹏和智谱 AI这一年证明了"长期主义"的价值。智谱的 ChatGLM 系列脱胎于清华计算机系的知识工程实验室(KEG),背后是 30 多年的技术积累。张鹏说:"我们不是 2023 年才开始做大模型的,我们做了十年了。"ChatGLM 开源后迅速成为国内最多开发者使用的中文大模型之一。
李开复在 2023 年 6 月创立了零一万物(01.AI),打出的旗帜是"AI 2.0"。这位 60 岁的 AI 老兵做了一辈子 AI——从 1988 年的博士论文、到微软亚洲研究院的创立、到谷歌中国的掌门、再到创新工场投出 AI 版图——但他说 2023 年是他见过最大的浪潮。"AI 1.0 是感知智能,AI 2.0 是认知智能。前者让人工智能学会'看'和'听',后者让它学会'想'和'写'。差距是一个时代。"
刘知远没有创业。这位清华大学计算机系的副教授,在 2023 年一边带学生一边开源了 ChatGLM-6B——一个只要一张消费级显卡就能跑的大模型。它在 GitHub 上获得了几万颗星。全世界的 AI 爱好者用它在自己的电脑上搭建私人助手。有人问他为什么不创业,他说:"学校的任务就是培养人和创造知识。创业的人够多了,但懂得教人的人和懂得创造基础理论的人,永远不够。"
朱啸虎,这个在互联网投资圈以"快进快出"闻名的金沙江创投合伙人,在 2023 年做了一个让所有人意外的判断:他看空大模型,但看好 AI 应用。"大模型是基础设施,基础设施从来不是最好的生意。最好的生意是站在基础设施之上,用最短的路径触达用户。"后来很多人想起这句话,觉得他可能是对的。
在合肥的一间实验室里,刘庆峰正带着科大讯飞的研究员们调整讯飞星火的对话模型。讯飞把大模型落地在了教育、医疗、政务——不是那些最性感的赛道,但可能是最实用的。刘庆峰说:"AI 不是用来替代人的,是用来让每个人变得更强的。"这句话在 2023 年被无数公司引用,但很少有人真正做到了——讯飞是其中之一。
而张一鸣,这个在 2012 年创立了字节跳动的福建人,在 2023 年正在做一件他在 2012 年做过的事:感知到范式转移,然后全力押注。字节跳动在 2023 年加速了 AI 的布局——从豆包大模型到 Flow 部门的重组,从 AI 应用到 TikTok 的 AI 功能升级。张一鸣很少公开露面谈论 AI,但他的策略不需要解释:字节跳动在 2023 年的 AI 人才招募数量,是 BAT 三家总和的两倍。
四、更远的源头
2023 年的故事不能只从 2022 年 11 月 30 日讲起。
六十年前,1956 年的达特茅斯夏季研讨会上,一群学者首次提出了"Artificial Intelligence"这个词。那年的会议提案只有一份,由麦卡锡、明斯基、香农和罗切斯特共同起草。他们乐观地认为一个夏天就能解决让机器像人一样思考的问题。六十年后,这个目标仍然只实现了一半——机器在某些方面已经超越了人,但在另一些方面,连一个三岁小孩的常识都不具备。
七年前,2016 年 3 月 9 日,韩国首尔四季酒店。全世界的目光聚焦在一张棋盘上。AlphaGo 对阵李世石,第三局。前两局 AlphaGo 已经 2:0 领先,但大部分人仍然不相信机器能赢。直到第 37 手——AlphaGo 下了一个所有职业棋手都认为"不可能是人类的选择"的位置。五位解说在直播间里同时沉默了十秒钟。李世石离席十五分钟。那一手棋被后来的 AI 研究者称为"上帝之手"——不是因为它完美,而是因为它揭示了机器的思维方式与人类完全不同,但在更高的维度上同样有效。这是公众第一次真正意识到:AI 不等于自动化,AI 是一种新的智能。
三个月前,2016 年 12 月,谷歌将 AlphaGo 的升级版 AlphaZero 的论文公之于众。它的核心创新只有一句话:不需要人类棋谱,从零开始自我对弈,仅用四个小时就超越了所有人类棋手的一切知识。输入只有规则,输出是不可理解的超级能力。那一刻,AI 不再是工具——它变成了一个可以自己进化自己然后超越人类的物种。
从达特茅斯的夏天到 2016 年的棋盘,再到 2023 年的对话框——人类用了 67 年,在五笔交互的界面里,把对 AI 的三个灵魂拷问逐一解答。
我们能造出会思考的机器吗?——能,而且它思考的方式和我们不一样。
它会超越我们吗?——在某些事情上已经超越了。
然后呢?——这个问题,2023 年的我们,还没想好答案。
2016 年至 2023 年这七年,中国 AI 创业者的命运齿轮也在悄悄转动:
地平线机器人的余凯,2015 年创办了这家 AI 芯片公司。2023 年他站在北京车展的展台上,展示地平线的芯片如何驱动智能汽车。他说:"AI 不只在云端,还应该在轮子上。"地平线后来在香港上市,成为中国 AI 芯片第一股。
商汤科技的汤晓鸥,中国计算机视觉领域的泰斗,他在 2023 年春节前夕离开了这个世界。他留下的商汤科技在 2023 年推出了"日日新"大模型。汤晓鸥生前常说的一句话是:"人工智能的终极目标不是取代人类,而是让人类更像人类。"2023 年 3 月,商汤的 OpenLab 实验室里,研究员们用日日新大模型复原了汤晓鸥的声音。他们播放那段音频的时候,实验室里没有人说话。
云天励飞的陈宁,2023 年带领公司在科创板上市。他的 AI 芯片落地到了城市治理、安防、智慧交通。"我不做最性感的 AI,我做最实用的 AI。"
而在深圳的一家小咖啡馆里,梁文锋正在修改 DeepSeek 的论文。2023 年的 DeepSeek 还没有引起主流关注——它只是一家低调的量化投资公司旗下的 AI 实验室。但梁文锋的团队正在做一件当时没人注意的事:用远低于行业的成本,训练出接近 GPT-4 水平的模型。这个故事的真正高潮在一年后才到来,但它的种子在 2023 年已经被精心种下。
尾声:那一次对话,定义了新的时代
2023 年的集体记忆之所以被后来反复提起,是因为每个人都在这一年完成了一次"第一次"——第一次用 AI 写一篇文章、第一次让 AI 改一段代码、第一次被 AI 的回答惊到说不出话、第一次对着屏幕打出"你是一个 AI,你怎么看……"。这些零散的、私人的、甚至有些可笑的第一次,叠加在一起,构成了一次文明的跃迁。
而那条从 2012 年开始被移动互联网铺平的路,经过十年的大数据喂养、算力堆叠和架构迭代,终于在 2023 年被一个对话框接入了几亿人的指尖。从 1994 年那条 64K 专线的星光,到 2012 年智能手机的爆发,再到 2023 年对话式 AI 的降临——三十年来,信息流动的方式完成了三次切换:从网页到应用,再到对话。
"你好,我是 ChatGPT。"——这句在 2023 年被说了上亿次的问候,定义的不仅是一个新产品,而是一种新的人机关系。这是人类历史上第一次,机器不是等待你去"操作"的工具,而是第一次回了一句"你好"。
当二零二三年被后来者提起时,我看见的不只是大模型的参数、融资的估值、百模大战的硝烟——我看见 1956 年达特茅斯那个夏天的妄想,终于在 67 年后变成了每个普通人指尖能触及的现实。
那是文明的齿轮,从 PC 的散热风口移向掌间的发光玻璃之后,第一次学会自己转动时,发出的一声清脆的——
咔嚓。
参考信息:ChatGPT 于 2022 年 11 月 30 日上线;GPT-4 于 2023 年 3 月 14 日发布;百度文心一言于 2023 年 3 月 16 日发布;百川智能于 2023 年 4 月创立;月之暗面于 2023 年 4 月成立;零一万物于 2023 年 6 月创立;《生成式人工智能服务管理暂行办法》于 2023 年 8 月 15 日施行;首批 8 家大模型于 2023 年 8 月 31 日通过备案。2023 年全年国内公布大模型数量超过 130 个。达特茅斯会议于 1956 年夏季举行;AlphaGo 对阵李世石于 2016 年 3 月。
夜雨聆风