AI正在学会＂自己教自己＂——2026年6月科技圈最值得关注的5件事

AI正在学会"自己教自己"

2026年6月科技圈最值得关注的5件事

深度观察

· 2026年6月29日

—— · ——

6月最后一周，AI圈出了两件足以写进科技史的事。

一件是：英伟达联合剑桥大学发布"红皇后哥德尔机"训练框架，让AI自己给自己出题，用更难的任务淘汰上一代模型，循环往复，永无止境。学术界有人称之为"年度最危险论文"。

另一件是：Anthropic联合创始人Jack Clark在阿斯彭研究所给出具体时间表——2028年底前，AI将实现"递归自我改进"，自主构建比自己更强的下一代模型，全程无需人类研究员参与。

两件事指向同一个信号：AI的进化动力，正在从"人类喂养"切换到"自我驱动"。这不是科幻，这是正在发生的工程现实。

一"红皇后哥德尔机"：AI自我进化的闸门被推开了

先讲清楚"红皇后哥德尔机"到底是什么。

这个名字出自《爱丽丝镜中奇遇记》里的一句台词——"在这个世界里，你必须拼命地跑，才能留在原地。"用它命名这套框架，再贴切不过了。

过去二十年，AI能力提升的路径大致是这样：人类标注员打标签 → 模型学习 → 人类设定评估基准 → 模型优化。整个过程里，人类始终是那个"外部驱动力"。模型不会自己设定目标，不会自己评估自己，更不会自己给自己"加难度"。

"红皇后哥德尔机"把这个逻辑彻底翻了过来。

它让AI在博弈式训练环境中，自发生成一个"考官"角色——这个考官不断设计更严苛的审查标准、更难的任务场景，来挑战当前版本的模型。模型必须通过"考官"的测试才能存活，失败则被淘汰。而每一次成功通过，新的经验又被用来训练更强大的"考官"，形成永无止境的螺旋进化。

用一个通俗的比喻：以前是人类当老师，AI当学生。现在AI既当学生也当老师，甚至这个"老师"还越来越严格。最终，"学生"的能力会超过任何人类老师能教的内容。

——这才是"年度最危险论文"的由来

研究人员在论文中披露的结果令人侧目：这套框架下，AI的代码通过率和论文接收率实现了"翻倍级提升"。更关键的是，这套系统在理论上可以无限运行——没有天花板。

二2028年，AI可能不再需要人类研究员

如果你觉得"红皇后哥德尔机"已经够激进，那Anthropic联合创始人Jack Clark的判断会让你重新思考"激进"的含义。

6月28日，Clark在阿斯彭研究所的活动中给出了极为具体的时间表。他说：到2028年底之前，递归自我改进（RSI）很可能成真——到时候，AI将自主发明并构建出比自己更强的下一代模型，整个过程无任何人类研究员参与。

他甚至给了一个产品的具象画面：Claude 10将是这一时间节点上的产物——一个由AI自己设计、自己训练、自己构建的AI。

请注意，Clark不是在做某种哲学讨论。他把自己的置信度打到了60%。这是工程判断，不是科幻想象。

把"红皇后哥德尔机"和Clark的预测放在一起读，你会发现它们形成了完美的互文：英伟达和剑桥在论文层面证明了"自我进化"可行，Clark则在产品路线图层面给出了"自我进化"的时间表。这不是巧合——AI的下一波能力跃迁，不会来自堆更多GPU、烧更多算力，而是来自AI自己学会"怎么让自己变强"。

如果这个判断成立，那我们现在讨论的"AI取代人类工作"可能只是序曲。真正的大叙事是：AI将要取代人类研究员，来设计下一代的AI。

· · ·

三"AI中间商"值20亿美元：商业模式正在被重新定义

讲完技术层面的变化，把视角转向商业。

6月29日凌晨，一家叫"演语科技"的公司宣布完成近3亿美元B+轮融资，投后估值突破20亿美元，成为国内AI应用领域的新晋独角兽。领投方是Granite Asia、腾讯、顺为资本。

这家公司的商业模式很有意思——它不做大模型，不做底座技术，不做底层架构。旗下拳头产品叫Liblib，核心能力只有一个：把市面上主流的视频生成模型、图像生成模型聚合到一个调度平台上，面向设计师和内容创作者提供一站式服务。

说白了，它是个"AI中间商"，赚的是"算力差价"和"工作流服务费"。

这个模式过去不太被看好。理由很直接——如果大模型本身迭代得越来越强、越来越便宜，靠"聚合别人模型"吃饭的中间商还有什么议价权？上游降一次价，中间商的利润池就缩水一圈。

但资本市场正在重新审视这个判断。原因不难理解：大模型迭代速度在加快，单一模型随时可能被下一版覆盖。对于大量中小企业和创作者来说，与其孤注一掷绑定某个模型，不如通过一个调度平台，始终用"当前最强的模型"——哪怕这意味着支付一个溢价。

AI中间商的本质是什么？本质是"替客户承担模型选型和切换的风险"。而风险定价，从来都是一门好生意。

这给了一个很重要的启示：AI产业的商业机会，不只在"造轮子"的人手里，也在"帮别人选轮子"的人手里。

· · ·

四DeepSeek：从"技术实验室"到"全栈商业体"

如果说Liblib代表AI应用层的模式创新，那DeepSeek的故事则代表了AI底座层的范式跃迁。

6月16日，DeepSeek完成创立以来首轮外部融资。融资规模约510亿元（相当于74亿美元），企业估值逼近4000亿元。这是中国AI史上最大的一笔单轮融资。

但这笔融资更值得关注的不是数字本身，而是背后的结构设计。

创始人梁文锋个人出资200亿元，成为最大单一出资方。外部投资者——包括腾讯、宁德时代、京东、网易、IDG资本等——的资金不是直接投向DeepSeek公司，而是注入梁文锋管理的有限合伙企业。这意味着外部投资者只享有经济权益，不介入公司决策流程。同时，所有投资者被设置了五年锁定期。

这个结构设计的目的非常明确：筛选长期资本，排除投机者，确保创始人对公司的绝对控制权。在市场普遍诟病"创始人被资本绑架"的当下，DeepSeek走出了一条完全不同的路。

拿到钱之后做什么？两个信号很明确。

第一，大规模招聘。DeepSeek正在从一家"技术极客工作室"向"全栈商业实体"转型。第二，技术加速。6月中旬，DeepSeek推出推理加速框架DSpark，通过"置信度调度"等技术实现吞吐量大幅提升。这意味着行业竞争正在从"卷算力"转向"卷效率"——用更少的资源跑出更大的产出。

把DeepSeek融资放在更大的图景里看：从国家数据局发布数据赋能AI的系统方案，到科创板为未盈利大模型企业开辟上市通道，再到资本市场上智谱市值突破万亿港元——2026年6月的中国AI产业，正在完成一场从"技术长跑"到"制度护航"的成人礼。

· · ·

五2880万次交互：中美AI的首次公开交锋

最后一条，表面看是一起商业纠纷，本质上是一场叙事权争夺战。

6月底，路透社和《华尔街日报》先后披露：Anthropic已正式向美国参议员和白宫官员提交材料，指控阿里通义千问模型在4月至6月期间，通过大约25000个虚假账号，与Claude进行了约2880万次交互，目的是"蒸馏"Claude的能力。

Anthropic的公开声明措辞强硬，称此类行为"违反其服务条款"，并强调"定义权、解释权、合法性"是下一代AI竞争的核心。换句话说，它不仅仅在说"你偷了我的能力"，更在说"判断谁对谁错的规则，应该由我来制定"。

这件事的争议点很复杂。一个模型通过另一个模型的输出来"学习"，在技术上到底算"抄袭"还是"学习"？边界在哪里？人类通过阅读书籍学习知识，AI通过"阅读"另一个AI的输出学习能力——这两件事的差别在哪里？

Anthropic的逻辑是：我用人类数据训练出来的闭源模型，你用虚假账号绕过了使用条款，成规模地获取我的输出用于训练，这就是对知识产权的侵犯。

反对者则说：如果"学习别人的输出"算侵权，那整个大模型行业从一开始就不合法，因为每一个模型在训练时都"消费"了大量人类创作者的作品。

这个问题目前没有共识。但它注定不会停留在Anthropic和阿里之间。它将是中美AI产业接下来无法回避的结构性矛盾——当一个国家最强的闭源模型被另一个国家最强的开源模型"蒸馏"，到底谁来定义"合理使用"的边界？

· · ·

最后的话

把这5件事串起来，你看到的不是一个简单的"新闻汇编"，而是一条清晰的逻辑线：

AI正在学会"自己教自己"（红皇后哥德尔机），而它教出来的下一代模型可能完全由AI自主构建（RSI预测）；当技术能力逼近临界点时，商业模式也在发生根本性的重构（AI中间商崛起）；底座层的竞争从"比谁钱多"转向"比谁效率高"（DeepSeek转型）；而地缘层面的规则制定权争夺也在同一时间激烈上演（Anthropic诉阿里蒸馏事件）。

技术、商业、制度、地缘——四重线索在6月最后一周同时发酵。

万联证券首席经济学家龙红亮的一句话值得记住："人工智能前沿竞争，不仅是技术储备与人才之争，更是资本市场效率的较量。"

这场竞赛的终局，不属于估值最高的公司，也不属于参数最大的模型。而属于那些能在自我进化的技术洪流中站稳位置、将代码能力转化为真实商业闭环的参与者。

未来已来，只是分布不均。