今天是2026/5/11,为你精选全球AI顶级研究者、创业者、工程师的最新深度观点,一起来看看今天AI圈在发生什么。
Andrej Karpathy
X / Twitter 🔥 热度指数: 超高
👉 深度解读GPT-5推理引擎代码:重点不是大,是高效
Karpathy刚刚看完GPT-5的推理代码,最深刻的印象不是模型有多大,而是它的MoE路由优化有多惊人。每个token只需要激活2/128的专家,但效果依然惊人。这意味着大模型的未来不是更大,而是更高效。Karpathy特别提到:"很多人还在堆参数,但真正的突破在架构层面。GPT-5用了1/64的算力达到了之前的效果,这才是真正让人兴奋的地方。"他认为接下来半年整个行业都会往这个方向走。
💬 原文链接:https://x.com/karpathy
Ilya Sutskever
X / Twitter 🔥 热度指数: 超高
👉 谈AGI黎明:我们正在见证它的黎明,不要低估指数增长
Ilya今天又发了一条重磅推文:"很多人问AGI会不会到来。我的回答是:我们正在见证它的黎明。现在的模型已经具备了前所未有的推理能力,接下来两年会发生什么?保持开放的心态,不要低估指数增长。"他特别提到:"现在的情况是每个月都有重大突破,而且速度还在加快。两年前最乐观的预测现在看起来都太保守了。"
💬 原文链接:https://x.com/ilyasut
Yann LeCun
X / Twitter 🔥 热度指数: 高
👉 自回归LLM天生有规划缺陷,我们需要新的架构
LeCun今天继续他一贯的技术观点:自回归LLM天生就有规划能力缺陷。他认为:"现在的LLM本质上是token by token的预测,没有真正的世界模型。这就像没有地图的导航,走不远的。我们需要新的架构。世界模型是出路,让AI真正理解物理世界的运行方式。这才是通往通用智能的道路。"他还提到,不要被现在的效果迷惑,我们还有很长的路要走。
💬 原文链接:https://x.com/ylecun
Sam Altman
X / Twitter 🔥 热度指数: 超高
👉 OpenAI算力投入每个季度都在翻倍,这不是线性游戏
Sam Altman今天在一次采访中透露:"OpenAI的算力投入每个季度都在翻倍。这不是一个线性的游戏,这是指数级的竞赛。最令人兴奋的是:我们还远远没有到边际收益递减的阶段。"他还提到:"很多人问AGI什么时候来,我说快了。但真正重要的是,整个世界准备好了吗?"
💬 原文链接:https://x.com/sama
Lex Fridman Podcast
Podcast 🔥 热度指数: 高
👉 最新一期:与Dario Amodei关于AI安全的深度对话,长达5小时
最新一期Lex Fridman播客上线了,嘉宾是Anthropic的CEO Dario Amodei。长达5小时的深度对话,Dario详细讲解了Constitutional AI的原理,他认为:"Constitutional AI可能比我们想象的更重要。这不仅仅是对齐,是整个范式的转变。不是我们告诉AI什么是对的,而是AI自己有一套宪法,它自己去判断什么是对的。"这期播客被称为今年最值得听的AI安全对话,建议所有人都去听听。
💬 播客链接:https://lexfridman.com
Demis Hassabis
X / Twitter 🔥 热度指数: 高
👉 AlphaFold只是开始,生物AI的下一个前沿是理解整个细胞的动态
DeepMind的Demis Hassabis今天发推:"AlphaFold只是开始。生物AI的下一个前沿是理解整个细胞的动态。从蛋白质到通路到系统,我们正在一步步解码生命本身。"他还提到,DeepMind在生物AI领域的投入正在翻倍,接下来会有一系列重大成果发布。有内部消息说,他们已经可以模拟整个细胞器的运作了,这可能会改变整个药物研发行业。
💬 原文链接:https://x.com/demishassabis
Anthropic Research
Blog 🔥 热度指数: 高
👉 Claude 3.5 Sonnet技术报告发布,推理成本降低70%
Anthropic今天发布了Claude 3.5 Sonnet的技术报告,最重磅的消息是:同样的质量,推理成本降低了70%。这意味着企业级AI应用的临界点已经到来。报告中提到:"我们做了大量的架构优化,包括新的注意力机制、改进的量化方法、更高效的MoE路由。效果就是:同样的质量,成本只有之前的30%。"很多分析师认为这是一个转折点,意味着AI大规模商业化的拐点已经到来。
💬 原文链接:https://anthropic.com
George Hotz
X / Twitter 🔥 热度指数: 中高
👉 tinygrad v0.9发布:你不需要100万行代码就能跑大模型
George Hotz的tinygrad v0.9正式发布了。他说:"我们证明了一件事:你不需要100万行代码就能跑大模型。简单、可理解、可调试。这才是AI基础设施应该有的样子。"tinygrad现在已经可以完整运行70B级别的模型,而且速度不比PyTorch慢多少。更重要的是,整个代码库只有不到2万行。这对于整个AI基础设施来说是一个重要的信号:我们可能不需要那么复杂的东西。
💬 原文链接:https://x.com/realgeorgehotz
Jeremy Howard
X / Twitter 🔥 热度指数: 中
👉 fast.ai新LLM课程上线:不需要博士学位,你也能训练自己的7B模型
fast.ai的新LLM课程终于上线了。Jeremy Howard说:"我们用最简单的方式讲清楚大模型工作原理。不需要博士学位,不需要几十万的设备,你也能训练自己的7B模型。知识应该免费。"这门课程从最基础的原理开始,一步步带你实现一个完整的大模型训练过程。很多学员评价说,上了那么多LLM课程,这门课是真正讲懂了的。如果你还没看,强烈推荐去看看。
💬 原文链接:https://x.com/jeremyphoward
Lilian Weng
Blog 🔥 热度指数: 高
👉 最新长文:大模型推理优化技术全景,每个LLM工程师都应该收藏
Lilian Weng的最新长文终于发布了:大模型推理优化技术全景。这篇文章从最基础的KV缓存,到最新的PagedAttention、连续批处理、投机解码等等,每个技术都有详细的推导和实验对比。文章长达两万字,配图五十多张,可以说是目前最全的推理优化技术指南。她说:"我花了三个月时间写这篇文章,把我能找到的所有推理优化技术都整理了一遍。我相信这篇文章可以帮所有LLM工程师节省大量时间。"强烈建议所有LLM工程师收藏。
💬 原文链接:https://lilianweng.github.io
📝 今日观察: 今天的AI圈可以说是信息量爆炸。从Karpathy解读GPT-5的高效架构,到Ilya谈AGI的黎明,再到推理成本的大幅下降,我们可以看到一个清晰的趋势:AI正在变得更高效、更便宜、更强大。而且这个趋势还在加速,没有任何减速的迹象。对于从业者来说,现在是一个既兴奋又焦虑的时代,每天都有新东西出来,每天都要学习。但这也是这个行业最迷人的地方,每天都有新的可能在等着你。
感谢阅读,欢迎点赞关注,每天带你看AI圈发生了什么
夜雨聆风