32岁,他从阿里离职,留下一个7亿次下载的AI帝国

"Me stepping down. Bye my beloved Qwen."

你猜怎么着，2026年3月4号凌晨，整个AI圈都在转这条推文。

一碗蛋炒饭的启发

有人问我，林俊旸到底牛在哪儿？

这么说吧——大部分人学AI，是先去啃算法、刷LeetCode、看论文，把编程能力当米饭打底。但林俊旸不一样。

他本科读的是英语系。不是计算机，不是数学，是那种毕业以后可以当翻译、外交官的那种专业。

23岁才开始学编程。

32岁，搞出了全球最大的开源大模型家族。

这就好比什么？就好比你楼下开了二十年的蛋炒饭摊，老板突然跟你说他以前是米其林三星的主厨——然后你吃了一口，发现确实比隔壁强。

北大三年：一场豪赌

2016年，林俊旸进了北大外国语学院，读语言学硕士。

听起来挺文科的对吧？

但他选了"计算语言学"这个方向。说白了，就是让机器理解人话——翻译、对话、情感分析，这些都是他的菜。

2017年，Google扔出了一篇论文，叫Transformer。这玩意儿在机器翻译上直接吊打了所有人。

林俊旸看到了。

没犹豫，撸起袖子就上。

不是"了解一下"，是真的动手写代码、跑实验、投论文。三年下来，ACL、EMNLP、IJCAI、KDD，他发了十几篇顶会论文。

什么概念？ACL是NLP领域的奥运会，全球几千篇文章投稿，录个几百篇。计算机博士能中一篇都可以写进简历了。

一个读语言学的硕士，三年十几篇。

嗯。

阿里七年：从打工人到P10

2019年进阿里，达摩院，高级算法工程师。

M6、OFA、Chinese-CLIP——这几个名字你不熟没关系，你只需要知道，都是当时最顶的预训练模型。

2022年，大模型风口来了。林俊旸被点名负责通义千问。

他不是那种闷头写代码的技术宅。在GitHub、在Hugging Face、在X上，全球开发者叫他"Justin Lin"，不叫"阿里AI"。

32岁，P10。

阿里技术岗的天花板，大多数人干一辈子都够不着的那种。

两个"不对口"的人

说到这儿，我想起另一个狠人——德米斯·哈萨比斯。

剑桥计算机毕业，干了几年游戏设计，突然决定去读神经科学的博士。

你周围的人肯定觉得你脑子有泡对吧：一个高材生，跑去研究大脑怎么回忆、怎么想象，这和写代码有什么关系？

有关系。

2009年他创立DeepMind，AlphaGo、AlphaFold这些改变世界的产品，背后都有神经科学的影子。他原话是这么说的：

"理解人类大脑，才能设计出更好的AI。"

林俊旸和哈萨比斯，走的是同一条路——跨出去，找到交叉点，然后起飞。

技术理想主义的黄昏

但事情在2026年3月4号变了。

林俊旸在X上发了那条推文。

"Me stepping down. Bye my beloved Qwen."

同事的留言挺有意思的："我知道离开并非你的选择。"

什么意思？意思就是——这次变动，可能不是他主动的。

在大厂待过的人都懂。技术理想和商业现实，迟早要打架。

离职20天后，他发了第一篇长文

你以为是抱怨？错了。

3月26日，也就是离职后不到一个月，林俊旸在X上（@JustinLin610）发布了离职后的第一篇长文，题目叫：

《从「推理式思考」到「智能体式思考」》

这篇文，系统性地复盘了他过去两年操刀Qwen后训练的经验，更重要的是——他直接亮出了对AI下一阶段的判断。

我读完最大的感受是：这人不是在写复盘，他是在画地图。

AI已经过了"想太久"的阶段

过去两年，整个行业都在围绕一件事卷：怎么让模型"想"得更多。

OpenAI的o1证明了"思考"可以专门训练；DeepSeek-R1证明了这事儿不是大厂专利。

但林俊旸说了一个很扎心的观点：

"推理链更长，不等于模型更聪明。"

什么意思？你让AI解一道数学题，它洋洋洒洒写一千字推理过程，但最后答案是错的——那这思考就是垃圾。

真正的问题变成了：什么时候该停止思考，开始动手？

他说AI正在进入一个新阶段

林俊旸的原话：

"我们正在从训练模型的时代，进入训练智能体的时代。"

他画了一张图，我帮你们翻译成人话：

推理式思考 = 闭卷考试，评判标准是交卷那一刻答案对不对。

智能体式思考 = 在真实世界里做一个项目，你得不断和环境交互、持续推进、解决问题。

区别在哪？

闭卷考试你可以蒙着头想，但做项目你得调用工具——搜索、执行代码、查文档、验证结果。模型得像一个真正的工程师，而不是一个只会背书的学霸。

Qwen3踩过的坑

这篇文章最值钱的地方，是林俊旸罕见地复盘了Qwen3在"融合思考"上的失误。

他们一开始想做的是一个模型同时搞定"思考"和"执行"两种模式。听起来很美好对吧？

但做下去发现：两种性格天然打架。

指令模型要的是：快、准、狠，批量处理，不废话
思考模型要的是：难题多花时间、保留推理痕迹、有思考余量

硬融到一起的结果是：思考的时候啰嗦犹豫，执行的时候又不够利落。两头都不讨好。

所以后来他们还是拆开了做，发布了独立的Instruct和Thinking版本。

林俊旸自己承认："说实话，我们在平衡融合与数据质量的过程中，没有把所有事情都做对。"

就冲这句坦白，我服。

开放的力量

不过他留下的东西，是实打实的。

Qwen，全球下载7亿次，衍生模型17万个，超越了Meta的Llama。

怎么做到的？开放。把模型开源，让全球开发者一起玩。

这像什么？就像你把火锅底料配方公开了，全国人民帮你研发新吃法，最后整出了麻辣烫、串串香、潮汕牛肉锅——每一个都比你原来那道菜影响力大。

封闭能活，但开放能大。

跨界这张牌

写到最后，我想说一个观点。

林俊旸的故事告诉我们一件事：AI时代最重要的竞争力，可能不是你会多少算法。

而是你怎么看待这个世界。

那些真正懂"人"的人——懂语言、懂情感、懂文化的人——可能比纯技术背景的人，更容易在AI领域找到独特的价值。

你孩子现在痴迷的东西，不管是生物，音乐还是画画，都可能是将来走进AI时，别人没有的那张牌。

至于林俊旸下一步去哪儿？

不知道。但我敢打赌，他不会闲着。

就像那碗蛋炒饭——你以为他只会做炒饭，结果人家还能整一桌满汉全席。