"Me stepping down. Bye my beloved Qwen."
你猜怎么着,2026年3月4号凌晨,整个AI圈都在转这条推文。
一碗蛋炒饭的启发
有人问我,林俊旸到底牛在哪儿?
这么说吧——大部分人学AI,是先去啃算法、刷LeetCode、看论文,把编程能力当米饭打底。但林俊旸不一样。
他本科读的是英语系。不是计算机,不是数学,是那种毕业以后可以当翻译、外交官的那种专业。
23岁才开始学编程。
32岁,搞出了全球最大的开源大模型家族。
这就好比什么?就好比你楼下开了二十年的蛋炒饭摊,老板突然跟你说他以前是米其林三星的主厨——然后你吃了一口,发现确实比隔壁强。
北大三年:一场豪赌
2016年,林俊旸进了北大外国语学院,读语言学硕士。
听起来挺文科的对吧?
但他选了"计算语言学"这个方向。说白了,就是让机器理解人话——翻译、对话、情感分析,这些都是他的菜。
2017年,Google扔出了一篇论文,叫Transformer。这玩意儿在机器翻译上直接吊打了所有人。
林俊旸看到了。
没犹豫,撸起袖子就上。
不是"了解一下",是真的动手写代码、跑实验、投论文。三年下来,ACL、EMNLP、IJCAI、KDD,他发了十几篇顶会论文。
什么概念?ACL是NLP领域的奥运会,全球几千篇文章投稿,录个几百篇。计算机博士能中一篇都可以写进简历了。
一个读语言学的硕士,三年十几篇。
嗯。
阿里七年:从打工人到P10
2019年进阿里,达摩院,高级算法工程师。
M6、OFA、Chinese-CLIP——这几个名字你不熟没关系,你只需要知道,都是当时最顶的预训练模型。
2022年,大模型风口来了。林俊旸被点名负责通义千问。
他不是那种闷头写代码的技术宅。在GitHub、在Hugging Face、在X上,全球开发者叫他"Justin Lin",不叫"阿里AI"。
32岁,P10。
阿里技术岗的天花板,大多数人干一辈子都够不着的那种。
两个"不对口"的人
说到这儿,我想起另一个狠人——德米斯·哈萨比斯。
剑桥计算机毕业,干了几年游戏设计,突然决定去读神经科学的博士。
你周围的人肯定觉得你脑子有泡对吧:一个高材生,跑去研究大脑怎么回忆、怎么想象,这和写代码有什么关系?
有关系。
2009年他创立DeepMind,AlphaGo、AlphaFold这些改变世界的产品,背后都有神经科学的影子。他原话是这么说的:
"理解人类大脑,才能设计出更好的AI。"
林俊旸和哈萨比斯,走的是同一条路——跨出去,找到交叉点,然后起飞。
技术理想主义的黄昏
但事情在2026年3月4号变了。
林俊旸在X上发了那条推文。
"Me stepping down. Bye my beloved Qwen."
同事的留言挺有意思的:"我知道离开并非你的选择。"
什么意思?意思就是——这次变动,可能不是他主动的。
在大厂待过的人都懂。技术理想和商业现实,迟早要打架。
离职20天后,他发了第一篇长文
你以为是抱怨?错了。
3月26日,也就是离职后不到一个月,林俊旸在X上(@JustinLin610)发布了离职后的第一篇长文,题目叫:
《从「推理式思考」到「智能体式思考」》
这篇文,系统性地复盘了他过去两年操刀Qwen后训练的经验,更重要的是——他直接亮出了对AI下一阶段的判断。
我读完最大的感受是:这人不是在写复盘,他是在画地图。
AI已经过了"想太久"的阶段
过去两年,整个行业都在围绕一件事卷:怎么让模型"想"得更多。
OpenAI的o1证明了"思考"可以专门训练;DeepSeek-R1证明了这事儿不是大厂专利。
但林俊旸说了一个很扎心的观点:
"推理链更长,不等于模型更聪明。"
什么意思?你让AI解一道数学题,它洋洋洒洒写一千字推理过程,但最后答案是错的——那这思考就是垃圾。
真正的问题变成了:什么时候该停止思考,开始动手?
他说AI正在进入一个新阶段
林俊旸的原话:
"我们正在从训练模型的时代,进入训练智能体的时代。"
他画了一张图,我帮你们翻译成人话:
推理式思考 = 闭卷考试,评判标准是交卷那一刻答案对不对。
智能体式思考 = 在真实世界里做一个项目,你得不断和环境交互、持续推进、解决问题。
区别在哪?
闭卷考试你可以蒙着头想,但做项目你得调用工具——搜索、执行代码、查文档、验证结果。模型得像一个真正的工程师,而不是一个只会背书的学霸。
Qwen3踩过的坑
这篇文章最值钱的地方,是林俊旸罕见地复盘了Qwen3在"融合思考"上的失误。
他们一开始想做的是一个模型同时搞定"思考"和"执行"两种模式。听起来很美好对吧?
但做下去发现:两种性格天然打架。
- 指令模型要的是:快、准、狠,批量处理,不废话
- 思考模型要的是:难题多花时间、保留推理痕迹、有思考余量
硬融到一起的结果是:思考的时候啰嗦犹豫,执行的时候又不够利落。两头都不讨好。
所以后来他们还是拆开了做,发布了独立的Instruct和Thinking版本。
林俊旸自己承认:"说实话,我们在平衡融合与数据质量的过程中,没有把所有事情都做对。"
就冲这句坦白,我服。
开放的力量
不过他留下的东西,是实打实的。
Qwen,全球下载7亿次,衍生模型17万个,超越了Meta的Llama。
怎么做到的?开放。把模型开源,让全球开发者一起玩。
这像什么?就像你把火锅底料配方公开了,全国人民帮你研发新吃法,最后整出了麻辣烫、串串香、潮汕牛肉锅——每一个都比你原来那道菜影响力大。
封闭能活,但开放能大。
跨界这张牌
写到最后,我想说一个观点。
林俊旸的故事告诉我们一件事:AI时代最重要的竞争力,可能不是你会多少算法。
而是你怎么看待这个世界。
那些真正懂"人"的人——懂语言、懂情感、懂文化的人——可能比纯技术背景的人,更容易在AI领域找到独特的价值。
你孩子现在痴迷的东西,不管是生物,音乐还是画画,都可能是将来走进AI时,别人没有的那张牌。
至于林俊旸下一步去哪儿?
不知道。但我敢打赌,他不会闲着。
就像那碗蛋炒饭——你以为他只会做炒饭,结果人家还能整一桌满汉全席。
夜雨聆风