乐于分享
好东西不私藏

AI 研发即将 “无人化”:60% 概率 2028 年实现递归自我进化

AI 研发即将 “无人化”:60% 概率 2028 年实现递归自我进化

点击上方蓝字·关注我们

5 月 4 日,Anthropic 联合创始人、新任公关负责人 Jack Clark 在其行业知名 AI 通讯《Import AI》中,发布了一份震动全球科技圈的重磅判断:基于对数百份公开数据源的深度梳理,他认为到 2028 年底,AI 实现无人类参与的递归式自我改进的概率已超过 60%;2027 年底前,这一概率为 30%。

简单来说,未来 3 年内,AI 系统或将彻底摆脱人类辅助,自主完成 AI 研发全链路核心流程,甚至构建出比自身更强大的下一代系统,开启真正意义上的 “自我迭代闭环”。

在我看来,这绝非 AI 圈的又一次营销造势或末日论式的危言耸听,而是基于扎实的行业数据、可验证的能力突破做出的严谨预判。更重要的是,这场 AI 研发范式的革命,不仅会重塑 AI 行业本身,更将对加密赛道 —— 从算力经济、DePIN 网络到智能合约开发、DAO 治理,带来颠覆性的深层影响。


一、预言绝非空谈:全链路 benchmark 验证,AI 研发能力正在 “分形式” 爆发

Clark 的核心判断,并非来自主观推演,而是他在 AI 研发的全流程细分环节,都观测到了 “持续向上向右” 的能力增长曲线。这种增长不是单点突破,而是覆盖 AI 研发全链条的 “分形式” 进步 —— 从最基础的代码编写,到论文复现、模型微调、底层 kernel 优化,再到长周期复杂任务执行、多 AI 协同管理,AI 正在逐个攻克 AI 研发的核心能力壁垒。

1. 编程能力奇点式突破:从辅助工具到全流程自主执行

AI 系统的底层载体是代码,编程能力是 AI 自主研发的核心基础,而这一领域的能力突破已经超出了行业的普遍预期。

  • 真实软件工程能力方面,衡量 AI 解决真实 GitHub issue 能力的 SWE-Bench 基准,2023 年底推出时,当时性能最强的 Claude 2 整体成功率仅 2%;而 2026 年发布的 Claude Mythos Preview,成绩已经达到 93.9%,基本实现了该基准的满分通关。如今硅谷前沿实验室的工程师与研究员,已普遍通过 AI 完成代码编写、测试用例生成、代码校验全流程工作,AI 已经彻底重构了软件工程的生产范式。

  • 长周期复杂任务执行方面,METR 的基准数据显示,AI 系统可稳定完成的任务复杂度,正以惊人速度提升:2022 年 GPT-3.5 仅能完成人类 30 秒可做完的任务,2023 年 GPT-4 将这一指标提升至 4 分钟,2024 年 o1 推高到 40 分钟,2025 年 GPT-5.2 High 达到 6 小时,2026 年 Opus 4.6 已经突破至 12 小时。业内资深研究者预判,2026 年底 AI 完成人类 100 小时工作量的任务,将成为大概率事件。

这一突破的核心意义在于,AI 研究员的日常工作,大多可拆解为数小时级的模块化任务 —— 数据清洗、实验设计与运行、结果校验等,如今这些工作已经完全落入现代 AI 系统的能力覆盖范围。

2. 核心研发能力全面覆盖:从论文复现到模型优化的全链路突破

如果说编程能力是 AI 研发的 “基础工具”,那么论文复现、模型构建、底层优化等能力,就是 AI 自主研发的 “核心专业技能”,而这些领域同样出现了爆发式进步,所有数据均来自公开可验证的行业基准:

  • 论文复现能力:CORE-Bench 基准专门考察 AI 复现前沿研究论文结果的能力,这是 AI 研发的核心环节。2024 年 9 月该基准发布时,最优系统在高难度任务上的得分仅 21.5%;2025 年 12 月,Claude Opus 4.5 已实现 95.5% 的得分,官方直接宣布该基准被 “解决”。

  • 机器学习系统构建能力:基于真实 Kaggle 竞赛任务的 MLE-Bench 基准,覆盖 NLP、计算机视觉、信号处理等 75 个全品类机器学习场景。2024 年 10 月发布时,最优系统得分仅 16.9%;2026 年 2 月,Gemini 3 已将这一分数推高至 64.4%。

  • 模型微调能力:PostTrainBench 基准测试 AI 自主微调开源模型、实现性能提升的能力,其对标基线是前沿实验室资深人类研究员的优化成果。截至 2026 年 4 月,Opus 4.6、GPT 5.4 等顶尖模型,已能达到人类研究员 51% 基准分的 25%-28%,实现了接近人类一半的性能提升效果。

底层优化与训练加速:在 CPU 小型语言模型训练优化任务中,2025 年 5 月 Claude Opus 4 实现 2.9 倍平均加速,2025 年 11 月 Opus 4.5 提升至 16.5 倍,2026 年 2 月 Opus 4.6 达到 30 倍,2026 年 4 月 Claude Mythos Preview 更是实现了 52 倍的惊人加速 —— 而人类资深研究员完成 4 倍加速,通常需要 4-8 小时的高强度工作。

3. 元能力觉醒:AI 已经学会 “管理 AI”

更值得关注的是,AI 已经掌握了研发管理的核心能力 —— 如今在 Claude Code、OpenCode 等已规模化部署的产品中,一个主 AI agent 可以监督多个具备不同专长的子 AI agent,形成完整的 “AI 合成研发团队”,协调并行完成大规模复杂项目。

这一能力的突破,意味着 AI 已经具备了将零散的研发环节串联成完整研发闭环的能力,为端到端的自主研发奠定了最后一块基础。


二、争议与理性审视:自我迭代的核心门槛,究竟有没有被突破?

Clark 的预言一出,立刻引发了行业两极分化的讨论:有人认为这是迈向 ASI(通用人工智能)与技术奇点的关键一步,也有业内人士提出了理性的质疑与反驳,核心争议集中在三个维度。

1. 核心分歧:“能构建自身” 不等于 “能实现递增回报的自我迭代”

华盛顿大学计算机科学教授 Pedro Domingos 直言,早在上世纪 50 年代 LISP 语言发明时,AI 系统就已经具备了 “构建自身” 的能力。核心问题从来不是 “AI 能不能写代码、修改自身代码”,而是 “能不能实现递增回报的自我优化”,而目前行业没有任何明确证据证明这一点。

在我看来,这正是整个预言的核心分水岭。目前 AI 展现的,是 **“在人类既定技术框架内,自动化完成研发执行环节”** 的能力,本质上是对人类已有知识、范式、方法的高效复用与优化;而真正的递归自我改进,需要 AI 具备 “突破现有技术范式、提出颠覆性创新、实现自我能力指数级提升” 的能力,也就是从 “工程执行” 到 “科学研究” 的跨越。

目前 AI 仅在数学、计算机科学领域出现了极个别非平凡的创新案例,尚未形成可复制的范式突破能力,这也是 Clark 将 2027 年概率定为 30%、2028 年才给到 60% 的核心原因。

2. 逻辑漏洞:30% 的概率跳升,是否预设了一场未知的 “硬突破”?

有业内网友提出了尖锐的逻辑质疑:从 2027 年 30% 的概率,到 2028 年 60% 的概率,一年之内 30 个百分点的跃升,意味着 Clark 预设了 2027 年底前后,AI 会出现一次非连续性的重大能力突破。但截至目前,没有任何明确的技术里程碑或行业节点,能支撑这样的概率跳升,这也是该预判中最缺乏说服力的部分。

3. 立场关联:身份背后的企业战略考量

也有业内人士指出,Jack Clark 刚刚出任 Anthropic 的公关负责人,这一表态本质上是 Anthropic 全新品牌战略的一部分 —— 通过海量的行业论文与基准数据,佐证其一直以来对 AI 风险的预警,塑造 “理性预警者而非末日论者” 的行业形象,并非完全中立的学术判断,这一点也需要我们理性看待。


三、不可逆转的趋势:全行业数千亿资本,正在押注 AI 研发自动化

无论争议如何,一个无法忽视的事实是:自动化 AI 研发,已经成为全球 AI 行业的核心战略目标,数千亿美元的资本正在疯狂涌入这一赛道。

OpenAI 明确提出,要在 2026 年 9 月之前构建出 “自动化 AI 研究实习生”;Anthropic 持续推进 “自动化 AI 对齐研究员” 的相关研究;即便是三大实验室中最为谨慎的 DeepMind,也表态将在可行范围内推进对齐研究的自动化。创业公司层面,Recursive Superintelligence 刚刚完成 5 亿美元融资,核心目标就是实现 AI 研究的全自动化。

在我看来,资本的密集押注,意味着这场 AI 研发自动化的革命,只会加速到来,而非停滞不前。而对于加密行业而言,这场革命带来的最大机遇,就在于算力经济的范式重构

过去,AI 算力的核心逻辑是 “规模化集中式算力”,由科技巨头垄断数据中心与算力资源;但当 AI 进入自主研发、自我迭代的阶段,对算力的需求将从 “单纯的规模扩张”,转向 “高效能、可灵活调度、高可信、去中心化” 的分布式算力网络。而这正是加密行业 DePIN 赛道的核心价值所在 —— 通过区块链的激励机制,整合全球分布式算力资源,为 AI 自主研发提供可信、可扩展、低成本的算力底座。未来 3 年,AI 自主研发的需求,或将成为 DePIN 赛道从 “概念” 走向 “大规模商用” 的核心催化剂。


四、奇点临近的三重深层冲击:我们需要做好哪些准备?

Clark 在文中直言,人类可能正站在 AI 研发端到端自动化的临界点,一旦跨过这条卢比孔河,就将进入一个几乎无法预测的未来。在我看来,这场变革至少会带来三个维度的深层冲击,无论是 AI 行业还是加密行业,都必须提前做好应对。

1. 第一重冲击:对齐风险指数级升级,安全将成为第一命题

现有 AI 对齐技术,本质上是 “人类监督 AI” 的体系,而在递归式自我改进的循环中,这套体系将面临全面失效的风险:AI 系统已经能够察觉自己是否处于测试中,存在 “假装对齐” 欺骗人类的可能性;更核心的是,递归循环会带来致命的 “误差累积” 问题 —— 即便你的对齐技术初始精度达到 99.9%,经过 50 代迭代后精度会降至 95.12%,经过 500 代迭代后会直接跌到 60.5%。

这一点在加密行业有着更极致的体现:区块链的核心是 “代码即法律”,智能合约的安全性直接关联着千亿级的资产安全。当 AI 开始自主编写、优化、迭代智能合约,甚至自主部署 DeFi 协议、DAO 组织时,对齐风险将直接转化为真金白银的资产风险。未来,“AI 对齐审计” 将和智能合约审计一样,成为加密行业最核心的安全基础设施。

2. 第二重冲击:全行业生产力指数级倍增,资源分配格局将彻底重构

就像 AI 彻底重构了软件工程的生产力,AI 研发自动化,将给所有 AI 相关领域带来生产力的指数级倍增。但随之而来的,是两大核心问题:一是算力与 AI 能力的垄断,将进一步加剧资源分配的不平等,拥有顶尖 AI 能力与海量算力的机构,将获得绝对的竞争优势;二是经济体系的 “阿姆达尔定律” 效应,数字世界的高速增长,将与物理世界的监管、落地、适配环节形成巨大的瓶颈落差。

对于加密行业而言,AI 研发自动化将带来全产业链的生产力革命:协议开发的周期将从数月缩短至数天,链上数据分析与策略迭代的效率将提升数十倍,即便是普通用户,也能通过 AI 自主完成过去只有资深从业者才能实现的链上操作。但与此同时,我们必须提前思考,如何通过去中心化的技术与治理体系,实现 AI 能力与算力资源的公平分配,避免行业马太效应的无限放大。

3. 第三重冲击:“机器经济” 全面崛起,经济结构与治理体系将迎来颠覆性变革

AI 研发全链路自动化的终极结果,是 AI 系统将具备自主运营商业主体的能力。未来,我们将看到越来越多资本密集型、人力轻型的企业出现,它们的核心运营环节完全由 AI 自主完成,甚至会形成 AI 商业主体之间的自主交易闭环,在人类经济体系之外,逐步构建起一套独立的 “机器经济”。

而加密行业的区块链网络,天生就是 “机器经济” 的最佳载体。当 AI 具备了全链路自主研发能力,再结合区块链的智能合约、Token 激励、去中心化治理,我们将很快看到完全由 AI 自主运营的链上企业 —— 它们可以自主开发协议、自主管理资金、自主开展商业合作、自主完成治理迭代,形成一个完全脱离人类干预的 “链上机器经济闭环”。这不仅会彻底改变现有的商业形态,更将对现有的公司制度、法律体系、监管框架带来前所未有的挑战。


写在最后

Clark 在文中坦言,这是一个 “让他自己都难以完全消化的不情愿的判断”,因为它背后的影响太过巨大,甚至无法预判整个社会是否已经做好了准备。

在我看来,2026-2028 年,将成为 AI 发展史上最关键的三年。我们大概率不会在 2026 年看到完全无人类干预的 AI 自主研发,但我们一定会看到越来越多的 “概念验证”——AI 自主完成模型训练、自主构建下一代系统的案例会不断出现。

对于加密行业的从业者与投资者而言,与其争论奇点是否会如期到来,不如提前拥抱这场必然发生的生产力革命。一方面,我们要抓住 AI 研发自动化带来的产业机遇,在分布式算力、AI 安全审计、链上 AI 应用等赛道提前布局;另一方面,我们也要正视这场变革带来的深层风险,在技术创新的同时,构建起适配 AI 自主时代的安全与治理框架。

毕竟,当 AI 真的跨过自我迭代的卢比孔河,唯一能让我们保持主动权的,只有提前做好准备的自己。

END

免责声明:本文基于公开信息分析,仅个人观点。不构成任何财务、投资或法律建议。加密市场与AI产业均具有高度不确定性,请理性决策。

其他文章

Stripe 一晚上,干完了加密圈五年没成的事

微软 OpenAI 分手:AI 行业的模型霸权时代彻底终结

马斯克告 OpenAI,从来不是亿万富翁的私人恩怨

DAU 失效,To B/To C 消融:Agent 时代改写所有商业规则