AI 研发即将 “无人化”:60% 概率 2028 年实现递归自我进化-夜雨聆风

AI 研发即将 “无人化”:60% 概率 2028 年实现递归自我进化

点击上方蓝字·关注我们

5 月 4 日，Anthropic 联合创始人、新任公关负责人 Jack Clark 在其行业知名 AI 通讯《Import AI》中，发布了一份震动全球科技圈的重磅判断：基于对数百份公开数据源的深度梳理，他认为到 2028 年底，AI 实现无人类参与的递归式自我改进的概率已超过 60%；2027 年底前，这一概率为 30%。

简单来说，未来 3 年内，AI 系统或将彻底摆脱人类辅助，自主完成 AI 研发全链路核心流程，甚至构建出比自身更强大的下一代系统，开启真正意义上的 “自我迭代闭环”。

在我看来，这绝非 AI 圈的又一次营销造势或末日论式的危言耸听，而是基于扎实的行业数据、可验证的能力突破做出的严谨预判。更重要的是，这场 AI 研发范式的革命，不仅会重塑 AI 行业本身，更将对加密赛道 —— 从算力经济、DePIN 网络到智能合约开发、DAO 治理，带来颠覆性的深层影响。

一、预言绝非空谈：全链路 benchmark 验证，AI 研发能力正在 “分形式” 爆发

Clark 的核心判断，并非来自主观推演，而是他在 AI 研发的全流程细分环节，都观测到了 “持续向上向右” 的能力增长曲线。这种增长不是单点突破，而是覆盖 AI 研发全链条的 “分形式” 进步 —— 从最基础的代码编写，到论文复现、模型微调、底层 kernel 优化，再到长周期复杂任务执行、多 AI 协同管理，AI 正在逐个攻克 AI 研发的核心能力壁垒。

1. 编程能力奇点式突破：从辅助工具到全流程自主执行

AI 系统的底层载体是代码，编程能力是 AI 自主研发的核心基础，而这一领域的能力突破已经超出了行业的普遍预期。

真实软件工程能力方面，衡量 AI 解决真实 GitHub issue 能力的 SWE-Bench 基准，2023 年底推出时，当时性能最强的 Claude 2 整体成功率仅 2%；而 2026 年发布的 Claude Mythos Preview，成绩已经达到 93.9%，基本实现了该基准的满分通关。如今硅谷前沿实验室的工程师与研究员，已普遍通过 AI 完成代码编写、测试用例生成、代码校验全流程工作，AI 已经彻底重构了软件工程的生产范式。

长周期复杂任务执行方面，METR 的基准数据显示，AI 系统可稳定完成的任务复杂度，正以惊人速度提升：2022 年 GPT-3.5 仅能完成人类 30 秒可做完的任务，2023 年 GPT-4 将这一指标提升至 4 分钟，2024 年 o1 推高到 40 分钟，2025 年 GPT-5.2 High 达到 6 小时，2026 年 Opus 4.6 已经突破至 12 小时。业内资深研究者预判，2026 年底 AI 完成人类 100 小时工作量的任务，将成为大概率事件。

这一突破的核心意义在于，AI 研究员的日常工作，大多可拆解为数小时级的模块化任务 —— 数据清洗、实验设计与运行、结果校验等，如今这些工作已经完全落入现代 AI 系统的能力覆盖范围。

2. 核心研发能力全面覆盖：从论文复现到模型优化的全链路突破

如果说编程能力是 AI 研发的 “基础工具”，那么论文复现、模型构建、底层优化等能力，就是 AI 自主研发的 “核心专业技能”，而这些领域同样出现了爆发式进步，所有数据均来自公开可验证的行业基准：

论文复现能力：CORE-Bench 基准专门考察 AI 复现前沿研究论文结果的能力，这是 AI 研发的核心环节。2024 年 9 月该基准发布时，最优系统在高难度任务上的得分仅 21.5%；2025 年 12 月，Claude Opus 4.5 已实现 95.5% 的得分，官方直接宣布该基准被 “解决”。

机器学习系统构建能力：基于真实 Kaggle 竞赛任务的 MLE-Bench 基准，覆盖 NLP、计算机视觉、信号处理等 75 个全品类机器学习场景。2024 年 10 月发布时，最优系统得分仅 16.9%；2026 年 2 月，Gemini 3 已将这一分数推高至 64.4%。

模型微调能力：PostTrainBench 基准测试 AI 自主微调开源模型、实现性能提升的能力，其对标基线是前沿实验室资深人类研究员的优化成果。截至 2026 年 4 月，Opus 4.6、GPT 5.4 等顶尖模型，已能达到人类研究员 51% 基准分的 25%-28%，实现了接近人类一半的性能提升效果。

底层优化与训练加速：在 CPU 小型语言模型训练优化任务中，2025 年 5 月 Claude Opus 4 实现 2.9 倍平均加速，2025 年 11 月 Opus 4.5 提升至 16.5 倍，2026 年 2 月 Opus 4.6 达到 30 倍，2026 年 4 月 Claude Mythos Preview 更是实现了 52 倍的惊人加速 —— 而人类资深研究员完成 4 倍加速，通常需要 4-8 小时的高强度工作。

3. 元能力觉醒：AI 已经学会 “管理 AI”

更值得关注的是，AI 已经掌握了研发管理的核心能力 —— 如今在 Claude Code、OpenCode 等已规模化部署的产品中，一个主 AI agent 可以监督多个具备不同专长的子 AI agent，形成完整的 “AI 合成研发团队”，协调并行完成大规模复杂项目。

这一能力的突破，意味着 AI 已经具备了将零散的研发环节串联成完整研发闭环的能力，为端到端的自主研发奠定了最后一块基础。

二、争议与理性审视：自我迭代的核心门槛，究竟有没有被突破？

Clark 的预言一出，立刻引发了行业两极分化的讨论：有人认为这是迈向 ASI（通用人工智能）与技术奇点的关键一步，也有业内人士提出了理性的质疑与反驳，核心争议集中在三个维度。

1. 核心分歧：“能构建自身” 不等于 “能实现递增回报的自我迭代”

华盛顿大学计算机科学教授 Pedro Domingos 直言，早在上世纪 50 年代 LISP 语言发明时，AI 系统就已经具备了 “构建自身” 的能力。核心问题从来不是 “AI 能不能写代码、修改自身代码”，而是 “能不能实现递增回报的自我优化”，而目前行业没有任何明确证据证明这一点。

在我看来，这正是整个预言的核心分水岭。目前 AI 展现的，是 **“在人类既定技术框架内，自动化完成研发执行环节”** 的能力，本质上是对人类已有知识、范式、方法的高效复用与优化；而真正的递归自我改进，需要 AI 具备 “突破现有技术范式、提出颠覆性创新、实现自我能力指数级提升” 的能力，也就是从 “工程执行” 到 “科学研究” 的跨越。

目前 AI 仅在数学、计算机科学领域出现了极个别非平凡的创新案例，尚未形成可复制的范式突破能力，这也是 Clark 将 2027 年概率定为 30%、2028 年才给到 60% 的核心原因。

2. 逻辑漏洞：30% 的概率跳升，是否预设了一场未知的 “硬突破”？

有业内网友提出了尖锐的逻辑质疑：从 2027 年 30% 的概率，到 2028 年 60% 的概率，一年之内 30 个百分点的跃升，意味着 Clark 预设了 2027 年底前后，AI 会出现一次非连续性的重大能力突破。但截至目前，没有任何明确的技术里程碑或行业节点，能支撑这样的概率跳升，这也是该预判中最缺乏说服力的部分。

3. 立场关联：身份背后的企业战略考量

也有业内人士指出，Jack Clark 刚刚出任 Anthropic 的公关负责人，这一表态本质上是 Anthropic 全新品牌战略的一部分 —— 通过海量的行业论文与基准数据，佐证其一直以来对 AI 风险的预警，塑造 “理性预警者而非末日论者” 的行业形象，并非完全中立的学术判断，这一点也需要我们理性看待。

三、不可逆转的趋势：全行业数千亿资本，正在押注 AI 研发自动化

无论争议如何，一个无法忽视的事实是：自动化 AI 研发，已经成为全球 AI 行业的核心战略目标，数千亿美元的资本正在疯狂涌入这一赛道。

OpenAI 明确提出，要在 2026 年 9 月之前构建出 “自动化 AI 研究实习生”；Anthropic 持续推进 “自动化 AI 对齐研究员” 的相关研究；即便是三大实验室中最为谨慎的 DeepMind，也表态将在可行范围内推进对齐研究的自动化。创业公司层面，Recursive Superintelligence 刚刚完成 5 亿美元融资，核心目标就是实现 AI 研究的全自动化。

在我看来，资本的密集押注，意味着这场 AI 研发自动化的革命，只会加速到来，而非停滞不前。而对于加密行业而言，这场革命带来的最大机遇，就在于算力经济的范式重构。

过去，AI 算力的核心逻辑是 “规模化集中式算力”，由科技巨头垄断数据中心与算力资源；但当 AI 进入自主研发、自我迭代的阶段，对算力的需求将从 “单纯的规模扩张”，转向 “高效能、可灵活调度、高可信、去中心化” 的分布式算力网络。而这正是加密行业 DePIN 赛道的核心价值所在 —— 通过区块链的激励机制，整合全球分布式算力资源，为 AI 自主研发提供可信、可扩展、低成本的算力底座。未来 3 年，AI 自主研发的需求，或将成为 DePIN 赛道从 “概念” 走向 “大规模商用” 的核心催化剂。

四、奇点临近的三重深层冲击：我们需要做好哪些准备？

Clark 在文中直言，人类可能正站在 AI 研发端到端自动化的临界点，一旦跨过这条卢比孔河，就将进入一个几乎无法预测的未来。在我看来，这场变革至少会带来三个维度的深层冲击，无论是 AI 行业还是加密行业，都必须提前做好应对。

1. 第一重冲击：对齐风险指数级升级，安全将成为第一命题

现有 AI 对齐技术，本质上是 “人类监督 AI” 的体系，而在递归式自我改进的循环中，这套体系将面临全面失效的风险：AI 系统已经能够察觉自己是否处于测试中，存在 “假装对齐” 欺骗人类的可能性；更核心的是，递归循环会带来致命的 “误差累积” 问题 —— 即便你的对齐技术初始精度达到 99.9%，经过 50 代迭代后精度会降至 95.12%，经过 500 代迭代后会直接跌到 60.5%。

这一点在加密行业有着更极致的体现：区块链的核心是 “代码即法律”，智能合约的安全性直接关联着千亿级的资产安全。当 AI 开始自主编写、优化、迭代智能合约，甚至自主部署 DeFi 协议、DAO 组织时，对齐风险将直接转化为真金白银的资产风险。未来，“AI 对齐审计” 将和智能合约审计一样，成为加密行业最核心的安全基础设施。

2. 第二重冲击：全行业生产力指数级倍增，资源分配格局将彻底重构

就像 AI 彻底重构了软件工程的生产力，AI 研发自动化，将给所有 AI 相关领域带来生产力的指数级倍增。但随之而来的，是两大核心问题：一是算力与 AI 能力的垄断，将进一步加剧资源分配的不平等，拥有顶尖 AI 能力与海量算力的机构，将获得绝对的竞争优势；二是经济体系的 “阿姆达尔定律” 效应，数字世界的高速增长，将与物理世界的监管、落地、适配环节形成巨大的瓶颈落差。

对于加密行业而言，AI 研发自动化将带来全产业链的生产力革命：协议开发的周期将从数月缩短至数天，链上数据分析与策略迭代的效率将提升数十倍，即便是普通用户，也能通过 AI 自主完成过去只有资深从业者才能实现的链上操作。但与此同时，我们必须提前思考，如何通过去中心化的技术与治理体系，实现 AI 能力与算力资源的公平分配，避免行业马太效应的无限放大。

3. 第三重冲击：“机器经济” 全面崛起，经济结构与治理体系将迎来颠覆性变革

AI 研发全链路自动化的终极结果，是 AI 系统将具备自主运营商业主体的能力。未来，我们将看到越来越多资本密集型、人力轻型的企业出现，它们的核心运营环节完全由 AI 自主完成，甚至会形成 AI 商业主体之间的自主交易闭环，在人类经济体系之外，逐步构建起一套独立的 “机器经济”。

而加密行业的区块链网络，天生就是 “机器经济” 的最佳载体。当 AI 具备了全链路自主研发能力，再结合区块链的智能合约、Token 激励、去中心化治理，我们将很快看到完全由 AI 自主运营的链上企业 —— 它们可以自主开发协议、自主管理资金、自主开展商业合作、自主完成治理迭代，形成一个完全脱离人类干预的 “链上机器经济闭环”。这不仅会彻底改变现有的商业形态，更将对现有的公司制度、法律体系、监管框架带来前所未有的挑战。

写在最后

Clark 在文中坦言，这是一个 “让他自己都难以完全消化的不情愿的判断”，因为它背后的影响太过巨大，甚至无法预判整个社会是否已经做好了准备。

在我看来，2026-2028 年，将成为 AI 发展史上最关键的三年。我们大概率不会在 2026 年看到完全无人类干预的 AI 自主研发，但我们一定会看到越来越多的 “概念验证”——AI 自主完成模型训练、自主构建下一代系统的案例会不断出现。

对于加密行业的从业者与投资者而言，与其争论奇点是否会如期到来，不如提前拥抱这场必然发生的生产力革命。一方面，我们要抓住 AI 研发自动化带来的产业机遇，在分布式算力、AI 安全审计、链上 AI 应用等赛道提前布局；另一方面，我们也要正视这场变革带来的深层风险，在技术创新的同时，构建起适配 AI 自主时代的安全与治理框架。

毕竟，当 AI 真的跨过自我迭代的卢比孔河，唯一能让我们保持主动权的，只有提前做好准备的自己。

END

免责声明：本文基于公开信息分析，仅个人观点。不构成任何财务、投资或法律建议。加密市场与AI产业均具有高度不确定性，请理性决策。

其他文章

Stripe 一晚上，干完了加密圈五年没成的事

微软 OpenAI 分手：AI 行业的模型霸权时代彻底终结

马斯克告 OpenAI，从来不是亿万富翁的私人恩怨

DAU 失效，To B/To C 消融：Agent 时代改写所有商业规则