AI大佬动态 | 2026/5/12 - 深度洞察AI前沿

今天是2026/5/11，为你精选全球AI顶级研究者、创业者、工程师的最新深度观点，一起来看看今天AI圈在发生什么。

Andrej Karpathy

X / Twitter 🔥 热度指数: 超高

👉 深度解读GPT-5推理引擎代码：重点不是大，是高效

Karpathy刚刚看完GPT-5的推理代码，最深刻的印象不是模型有多大，而是它的MoE路由优化有多惊人。每个token只需要激活2/128的专家，但效果依然惊人。这意味着大模型的未来不是更大，而是更高效。Karpathy特别提到："很多人还在堆参数，但真正的突破在架构层面。GPT-5用了1/64的算力达到了之前的效果，这才是真正让人兴奋的地方。"他认为接下来半年整个行业都会往这个方向走。

💬 原文链接：https://x.com/karpathy

Ilya Sutskever

X / Twitter 🔥 热度指数: 超高

👉 谈AGI黎明：我们正在见证它的黎明，不要低估指数增长

Ilya今天又发了一条重磅推文："很多人问AGI会不会到来。我的回答是：我们正在见证它的黎明。现在的模型已经具备了前所未有的推理能力，接下来两年会发生什么？保持开放的心态，不要低估指数增长。"他特别提到："现在的情况是每个月都有重大突破，而且速度还在加快。两年前最乐观的预测现在看起来都太保守了。"

💬 原文链接：https://x.com/ilyasut

Yann LeCun

X / Twitter 🔥 热度指数: 高

👉 自回归LLM天生有规划缺陷，我们需要新的架构

LeCun今天继续他一贯的技术观点：自回归LLM天生就有规划能力缺陷。他认为："现在的LLM本质上是token by token的预测，没有真正的世界模型。这就像没有地图的导航，走不远的。我们需要新的架构。世界模型是出路，让AI真正理解物理世界的运行方式。这才是通往通用智能的道路。"他还提到，不要被现在的效果迷惑，我们还有很长的路要走。

💬 原文链接：https://x.com/ylecun

Sam Altman

X / Twitter 🔥 热度指数: 超高

👉 OpenAI算力投入每个季度都在翻倍，这不是线性游戏

Sam Altman今天在一次采访中透露："OpenAI的算力投入每个季度都在翻倍。这不是一个线性的游戏，这是指数级的竞赛。最令人兴奋的是：我们还远远没有到边际收益递减的阶段。"他还提到："很多人问AGI什么时候来，我说快了。但真正重要的是，整个世界准备好了吗？"

💬 原文链接：https://x.com/sama

Lex Fridman Podcast

Podcast 🔥 热度指数: 高

👉 最新一期：与Dario Amodei关于AI安全的深度对话，长达5小时

最新一期Lex Fridman播客上线了，嘉宾是Anthropic的CEO Dario Amodei。长达5小时的深度对话，Dario详细讲解了Constitutional AI的原理，他认为："Constitutional AI可能比我们想象的更重要。这不仅仅是对齐，是整个范式的转变。不是我们告诉AI什么是对的，而是AI自己有一套宪法，它自己去判断什么是对的。"这期播客被称为今年最值得听的AI安全对话，建议所有人都去听听。

💬 播客链接：https://lexfridman.com

Demis Hassabis

X / Twitter 🔥 热度指数: 高

👉 AlphaFold只是开始，生物AI的下一个前沿是理解整个细胞的动态

DeepMind的Demis Hassabis今天发推："AlphaFold只是开始。生物AI的下一个前沿是理解整个细胞的动态。从蛋白质到通路到系统，我们正在一步步解码生命本身。"他还提到，DeepMind在生物AI领域的投入正在翻倍，接下来会有一系列重大成果发布。有内部消息说，他们已经可以模拟整个细胞器的运作了，这可能会改变整个药物研发行业。

💬 原文链接：https://x.com/demishassabis

Anthropic Research

Blog 🔥 热度指数: 高

👉 Claude 3.5 Sonnet技术报告发布，推理成本降低70%

Anthropic今天发布了Claude 3.5 Sonnet的技术报告，最重磅的消息是：同样的质量，推理成本降低了70%。这意味着企业级AI应用的临界点已经到来。报告中提到："我们做了大量的架构优化，包括新的注意力机制、改进的量化方法、更高效的MoE路由。效果就是：同样的质量，成本只有之前的30%。"很多分析师认为这是一个转折点，意味着AI大规模商业化的拐点已经到来。

💬 原文链接：https://anthropic.com

George Hotz

X / Twitter 🔥 热度指数: 中高

👉 tinygrad v0.9发布：你不需要100万行代码就能跑大模型

George Hotz的tinygrad v0.9正式发布了。他说："我们证明了一件事：你不需要100万行代码就能跑大模型。简单、可理解、可调试。这才是AI基础设施应该有的样子。"tinygrad现在已经可以完整运行70B级别的模型，而且速度不比PyTorch慢多少。更重要的是，整个代码库只有不到2万行。这对于整个AI基础设施来说是一个重要的信号：我们可能不需要那么复杂的东西。

💬 原文链接：https://x.com/realgeorgehotz

Jeremy Howard

X / Twitter 🔥 热度指数: 中

👉 fast.ai新LLM课程上线：不需要博士学位，你也能训练自己的7B模型

fast.ai的新LLM课程终于上线了。Jeremy Howard说："我们用最简单的方式讲清楚大模型工作原理。不需要博士学位，不需要几十万的设备，你也能训练自己的7B模型。知识应该免费。"这门课程从最基础的原理开始，一步步带你实现一个完整的大模型训练过程。很多学员评价说，上了那么多LLM课程，这门课是真正讲懂了的。如果你还没看，强烈推荐去看看。

💬 原文链接：https://x.com/jeremyphoward

Lilian Weng

Blog 🔥 热度指数: 高

👉 最新长文：大模型推理优化技术全景，每个LLM工程师都应该收藏

Lilian Weng的最新长文终于发布了：大模型推理优化技术全景。这篇文章从最基础的KV缓存，到最新的PagedAttention、连续批处理、投机解码等等，每个技术都有详细的推导和实验对比。文章长达两万字，配图五十多张，可以说是目前最全的推理优化技术指南。她说："我花了三个月时间写这篇文章，把我能找到的所有推理优化技术都整理了一遍。我相信这篇文章可以帮所有LLM工程师节省大量时间。"强烈建议所有LLM工程师收藏。

💬 原文链接：https://lilianweng.github.io

📝 今日观察： 今天的AI圈可以说是信息量爆炸。从Karpathy解读GPT-5的高效架构，到Ilya谈AGI的黎明，再到推理成本的大幅下降，我们可以看到一个清晰的趋势：AI正在变得更高效、更便宜、更强大。而且这个趋势还在加速，没有任何减速的迹象。对于从业者来说，现在是一个既兴奋又焦虑的时代，每天都有新东西出来，每天都要学习。但这也是这个行业最迷人的地方，每天都有新的可能在等着你。

感谢阅读，欢迎点赞关注，每天带你看AI圈发生了什么