AI大佬动态 | 2026/6/1 - 顶级AI研究者最新观点

AI圈从不缺热点和思考。今天多位顶级大佬分享了对AI未来发展的最新观点：从MoE架构的效率优化，到世界模型的发展方向，再到算力投入的指数增长，大佬们的思考值得我们认真品读。

Andrej Karpathy

X 🔥 热度指数

👉 MoE架构的关键在于高效激活

刚看完GPT-5的推理代码，Karpathy印象最深刻的是MoE路由的优化。在MoE架构中，每个token只需要激活一小部分专家，GPT-5中每个token只激活2/128的专家，但效果依然惊人。他想强调的重点不是模型更大，而是架构更高效。这给我们一个启发：未来AI模型的发展方向不一定是简单地堆叠参数，而是通过更好的架构设计提升计算效率。

💬 原文链接：https://x.com/karpathy

Ilya Sutskever

X 🔥 热度指数

👉 AGI的黎明已经到来

当很多人问Ilya SutskeverAGI会不会真的到来时，他的回答很直接：我们正在见证它的黎明。现在的模型已经具备了前所未有的推理能力，这种能力进步的速度超出了大多数人的预期。接下来两年会发生什么？他提醒我们保持开放的心态，千万不要低估指数增长的力量。作为OpenAI联合创始人，Ilya的判断值得我们重视。

💬 原文链接：https://x.com/ilyasut

Yann LeCun

X 🔥 热度指数

👉 自回归LLM天生有规划能力缺陷

Yann LeCun一直坚持他的观点：自回归LLM天生就有规划能力缺陷。我们需要全新的架构，而世界模型就是出路。只有让AI真正理解物理世界的运行方式，才能走出当前架构的瓶颈。这才是通往通用智能的正确道路。尽管现在大语言模型占据了所有焦点，但LeCun始终没有动摇他对世界模型方向的信念，这种坚持值得尊重。

💬 原文链接：https://x.com/ylecun

Sam Altman

X 🔥 热度指数

👉 算力投入每个季度都在翻倍

OpenAI的Sam Altman透露：OpenAI的算力投入每个季度都在翻倍。这不是一个线性的游戏，这是指数级的竞赛。最令人兴奋的一点是：我们还远远没有到达边际收益递减的阶段。这句话透露出很多信息——OpenAI对当前模型能力提升的节奏非常有信心，算力增长仍然在驱动能力快速提升。对于整个行业来说，这意味着惊喜还在后面。

💬 原文链接：https://x.com/sama

Lex Fridman

Podcast 🔥 热度指数

👉 与Dario Amodei深度对话AI安全

Lex Fridman最新一期播客邀请了Anthropic创始人Dario Amodei，深度讨论AI安全问题。Dario Amodei谈到Constitutional AI方法，认为这种方法可能比我们想象的更重要。这不仅仅是对齐技术的问题，这可能是整个AI开发范式的转变。通过让AI理解宪法原则来自我纠正，这种思路越来越受到重视。这期播客值得所有关心AI安全的朋友认真收听。

💬 原文链接：https://lexfridman.com

Demis Hassabis

X 🔥 热度指数

👉 AlphaFold只是开始，生物AI下一站是理解整个细胞

DeepMind的Demis Hassabis表示：AlphaFold只是开始。生物AI的下一个前沿是理解整个细胞的动态。从蛋白质结构预测到信号通路分析，再到整个细胞系统层面的模拟，我们正在一步步解码生命本身。这种从微观到宏观的进展，可能会在未来十年带来生物医药领域的革命性突破。AlphaFold已经改变了结构生物学，接下来整细胞模拟可能会改变药物研发。

💬 原文链接：https://x.com/demishassabis

Anthropic Research

Blog 🔥 热度指数

👉 Claude 3.5 Sonnet推理成本降70%

Anthropic Research发布Claude 3.5 Sonnet技术报告，他们在推理效率上取得了重大突破：保持同样质量的情况下，推理成本降低了70%。这是一个非常重要的信号——企业级AI应用的临界点已经到来。当大模型推理成本降到足够低，很多之前不经济的应用场景现在变得可行了。效率优化和成本下降正在持续推动AI更大范围的普及。

💬 原文链接：https://anthropic.com

George Hotz

X 🔥 热度指数

👉 tinygrad v0.9发布，证明简单才是美

George Hotz宣布tinygrad v0.9发布，他想用这个项目证明一件事：你不需要100万行代码就能跑大模型。tinygard坚持简单、可理解、可调试的设计哲学，这才是AI基础设施应该有的样子。在业界都在往越来越复杂方向走的时候，tinygard反其道而行之，追求简洁优雅。这种思路值得每个AI基础设施开发者思考。

💬 原文链接：https://x.com/realgeorgehotz

Jeremy Howard

X 🔥 热度指数

👉 新LLM课程上线，知识应该免费

fast.ai创始人Jeremy Howard宣布新的LLM课程上线了。课程坚持fast.ai一贯的理念：用最简单的方式讲清楚大模型工作原理。不需要博士学位，不需要几十万的GPU设备，你也能训练自己的7B模型。Jeremy Howard一直坚信知识应该免费开放，让更多人能够参与到AI革命中来。这种普惠AI的理念值得点赞，降低门槛才能让更多人参与创新。

💬 原文链接：https://x.com/jeremyphoward

Lilian Weng

Blog 🔥 热度指数

👉 大模型推理优化技术全景综述

lilianweng.github.io更新长文，全面综述大模型推理优化技术。从KV缓存到PagedAttention，从连续批处理到投机解码，每个技术都有详细的推导和实验对比。Lilian Weng的博客一直是AI领域的优质读物，这篇文章更是LLM推理工程师必备，建议所有做推理优化和部署的工程师收藏。当越来越多模型开始落地部署，推理优化变得越来越重要。

💬 原文链接：https://lilianweng.github.io

💡 今日观察：
今天分享的10条动态来自AI领域最顶级的头脑，你可以看到几个趋势：第一，大家越来越关注效率优化，无论是MoE路由还是推理成本下降，效率是现在的关键词；第二，关于架构路线的争论还在继续，LeCun坚持世界模型，其他人在持续优化LLM；第三，普惠AI理念越来越受欢迎，让更多人能低成本参与AI创新。你同意哪位大佬的观点？欢迎在评论区留言讨论。

感谢阅读，欢迎点赞关注，每日为你追踪AI大佬最新动态