OpenAI co-founder Karpathy 加入Anthropic
5 月 19 日,Andrej Karpathy 宣布加入 Anthropic。
这条新闻之所以刷屏,不是因为“AI 大牛换公司”本身,而是因为他的身份和去向放在一起,信息量太高:OpenAI 早期创始成员、前 Tesla AI 负责人,如今进入 Claude 背后的公司。Karpathy 在官宣中说,未来几年将是 LLM 前沿发展“尤其成型”的阶段,他很兴奋能回到 R&D。
真正的重点,不是 Anthropic 多了一个明星人物,而是 Karpathy 加入的是 pretraining team。
这是 Claude 的底层训练团队。Reuters 报道称,这个团队负责 Claude 的大规模训练,让模型获得核心知识和能力。换句话说,Karpathy 不是去做产品包装,也不是做外围顾问,而是进入了 Claude 能力形成的核心位置。
这也是这条新闻最值得看的地方。
今天普通用户看到的大模型竞争,是谁回答更稳、谁写代码更强、谁上下文更长、谁价格更低。但对前沿模型公司来说,真正决定长期位置的,仍然是底层训练能力。
Claude 能不能继续往前走,不只取决于界面、功能和发布节奏,更取决于模型底座能不能持续进化。
Karpathy 的特殊性也在这里。他不是单一类型的研究员。他做过 OpenAI 的早期研究,后来在 Tesla 负责 AI 和自动驾驶相关工作,又长期用课程、视频和文章把复杂的神经网络、大模型问题讲清楚。研究、工程、表达,这三种能力很少集中在同一个人身上。
而 pretraining 恰恰不是单点技术问题。它需要研究判断,也需要工程组织,还需要对复杂系统的理解。
所以,这不是一条简单的“OpenAI 旧将加入 Anthropic”新闻。
更准确地说,是一个理解模型、工程和 AI 教育的人,重新回到前沿大模型 R&D,并进入 Claude 的底层训练现场。
Karpathy 这次去的地方,离普通用户很远,却离模型能力的源头很近。
一句话看懂这条新闻:
重点不是 Karpathy 加入了 Anthropic,重点是他去了 Claude 的底层。
夜雨聆风