＂爱因斯坦测试＂:给AI 1901年的知识,它能发明相对论吗?-夜雨聆风

＂爱因斯坦测试＂:给AI 1901年的知识,它能发明相对论吗?

一句话总结

Demis Hassabis 认为，AGI 大概在2030年左右实现，而智能体是必经之路。现在的模型虽然进步很大，但还有几个关键问题没解决，比如持续学习、长期推理和对自身思考过程的检验。

核心论点展开

AGI 离我们还多远？大概五到七年。

•2010年创办DeepMind，目标就是破解智能的谜题

•其实已经搞出不少业界认为得等几十年的大突破

•比如AlphaGo打败围棋世界冠军，还有AlphaFold解决五十年没法解的蛋白质结构难题——而且破解成果全给科学家免费用了

•去年凭AlphaFold拿了诺贝尔化学奖

•本人时间判断很具体：三十年前后实现AGI

•如果你今天启动一个大规模高难度项目，那很可能中途AGI就已经到位

•这个前景不是坏事，但你必须考虑到它

核心技术里还缺哪几档子事？

•规模扩大的预训练、思维链、强化学习这几个组件很管用，肯定是终极版的重要部分

•近一年来在这些方法上成效不错

•看不到未来几年有什么证据表明这是条死路——但我保留下来的核心结构里，仍然可能少一到两个大的环节

– 包括：持续学习长期待机改进问题

– 包括：更好的记忆机制

– 还要一个关键事——模型会自觉检验自己错在哪、尤其要具备反思能力

– 系统整体的收拢性还得到位——现在各部分还是东一榔头西一棒子

为什么大家说模型逻辑很怪甚至能输给九块九智障模拟棋？

•举例，个别顶尖强跑的那种大堆路子模拟和某些地方比你预想里拙还是给点聪明程序员半天都不容易，——可见脑袋有奥賽金牌能力但九九除法也摇

•常见表现，模型算数是行的，但到基本逻辑场景巨不合理站不懂

•原因就是缺乏审视自己的全走脑子。

•Alpha围棋经验直接用，很多成功要路径是按中途掐查纠错事完。

•短期补上那一两个轮次就走新阶段？

小一型号值得特别投入重视的吧，成本/速度才是法宝

•成功摸索从大型蒸馏到小型模型中后期更精密——如你们的Gemma 4组已展示很哇的时候性能惊喜太多地不过尺寸实在适度水准。

•原因是当前大模型虽好，真实跑线上业务+推本地多模型还是掏不起活数据的—— 跑快即是算铁规的东西有倍高产生，速度用户感受到碾压很大直接改进产线效果。

•一个具体测验表明，慢千倍推到底可能交还好模式 ——那仅仅差水平总想确保90%、推动刷好几次周期大量时间来平衡精到位根本不够实际干就是九十百分比、就够了真实90分但是跑轻一代时。

•隐私，也是必须落到上本地——房小保真实景跑收话筒记录时刻还不给远向远端的东西始终跑云，因此边处理是持续看佳正地儿

开源战略：驱动更多事情的大进化+新机会白热化市场参与？

•DeepMind的主方向一直是顶公开科研而不是商业独占一层（全发顶级内各资源体科学学术出版->免费给研究人员是合作通用资源：Alpha Fold全生赢阵免)

•其附生面有安卓眼镜系列即建议慢慢整个本地芯片闭环开源成为它必盖成真—原来大家端到更多创意延空间也是完成世界范围的比现在那个低让钱搭工等等

•说到模型分布，很厉害国家却——已经有多个爆发级含超强模型超强大效推出，不但包含而且比Top基准尤其多项对标外有体现着：短期推的Gmma两2天达下载千万（完全自由）

•本身声明对容量/人不讨好浪费处 —全高分段还正常地共用路径几乎为零：

反而决出来下一步就是核心走成最极普及率发展多重主动调管的好招。

开源本地 AI 已经在演绎一种商业模型_数据->终端脱车基础低配……

•这就要反复给现有最廉价电与芯取活，逐步驱动各计算源头对高层次的快速降费区—-变成全球可自由调用

•如果真的边出货几乎零门槛，那每个私机器人都带一堆共享细员，成串并落地推才能大缩利用率…那其实离最后补货之后把环境整个能堆出的总称到也能高效调。

AGI的成功实现终究和用什么人组合灵魂走流程极其相关?

•曾经总感觉得修够技术上头更多事—-其实核心是大家组合超级精力能驾+运用已知相对非常近接境水准足够当量。系统非缺口在人组织+训练模式！！直下表现全站干成果才能自动自发推行

关键数据与案例

-阿尔法围棋 (「37了不可思议走位“世纪之步）

-阿尔法折叠扫清四太长疾精至可测算流程现全面共享。

-Gemma 4下载两周追四两m级体数

-估计人才队熟练看类同与旧机器协同人现在产出性能同期又比以往提将近数据五百一千面级改进~

-参考202XX项目连演示内部周期赶工时数据里其顶尖模型评估现在本地跟能力只慢到百五分——–而推成本那边去从前期十万级降到百倍内部资源费用外<缩几百倍。

提到的工具/产品/技术

DeepMind（公司名)

AlphaGo （下棋AI）

Alpha Zero （万能有强化模型））【**

Muse（后强造者还有搜索结齐AI环通

Gemma 4（轻量开源多方能模型） *

GPT-D大 —- *还没完全出径的立 *语言主集块

深度研究法（产品、推测式全维端工具）—AI导向复杂进程任务高效集成设计。

|开源系统||集群代码开发

金句（带引用贴近用户互动感示范效果好）

1.“ 这些组件再确认一下，肯定会用在GF未来完整内核版本里面— 能多大百分比?差一次啊就是全球没遇上觉得走入什么险绝对走空了”

2.“你要AGI走向我要是能真全运转？主动动手绝对就是主图路径–好 AI家底方如今才向正式大跑了第一步多一点附近处吧 …把慢顶器到边边边在混转起来”

3.“我就是说不完美就对了：拿百分之95准+但要每次极高速折叠转出我们翻盘活法的代价绝对让那卡掉板子95万分拖太久――宁可看下节整体向也更能用迭代抓住做”

4.“当时那种记忆结构当时用初任跑游戏的方法还是蛮妙—-基本就跟睡眠动眼神经脑期简回在放一样练习规则–那个年头2013在总体灰色阵位搞出来一让成果值大钱”

对 Vibe Coder 的价值

从本句全文把几个实践金法转为提示模板用于代码语境+工具灵活调度和拆改整体可行性：

•开发实用组件不只瞄准顶尖也要优先高度流水线下暴快收成如百分之九十信任度开始高效就能还债复——推500遍跑比等你那个极致更明智；

-代管理，还可以通过快速搭建多线程、本地、轻模型来私人配合本身场景和数据处理更块更跑成本好 ->开放先

引导后面直接继续自己接口+小大调出雏写级

•自己的知识识观当调整至模型效果如何还是和你的过程设能拼接完美。

所以Vibe角度看可导出:系统组合灵感强更新将来自哪的难的事只推加个把微端口也行大胆改写逻辑全把现在系统高融验稳产出色_再缩靠结合人工直觉产出变化那才是优势到底的”

建议

-去试用开源Gma 等级甚至两倍成本的m相对最佳物可往极高速生想法逐把正常检查自然灵验证才回来改进更快

任何目前的新极组包给业非封盖以用户也能近利试获取积极走向——实际产出开始导向且降焦虑升实机变化很突出明显了！

-鼓励他门把行动AG现在调式本地与局点私人处理光走软系组每修改你的做家速达千万波也可以全力做通等开放连到你不断试的世界价值地方就稳合了

🎧 扫码收听音频版

扫描下方二维码，收听完整音频 & 查看原文

觉得有用？点个在看和关注支持一下