AI正在学会"自己教自己" 2026年6月科技圈最值得关注的5件事 |
| 深度观察 |
6月最后一周,AI圈出了两件足以写进科技史的事。 一件是:英伟达联合剑桥大学发布"红皇后哥德尔机"训练框架,让AI自己给自己出题,用更难的任务淘汰上一代模型,循环往复,永无止境。学术界有人称之为"年度最危险论文"。 另一件是:Anthropic联合创始人Jack Clark在阿斯彭研究所给出具体时间表——2028年底前,AI将实现"递归自我改进",自主构建比自己更强的下一代模型,全程无需人类研究员参与。 两件事指向同一个信号:AI的进化动力,正在从"人类喂养"切换到"自我驱动"。这不是科幻,这是正在发生的工程现实。 |
一"红皇后哥德尔机":AI自我进化的闸门被推开了 |
先讲清楚"红皇后哥德尔机"到底是什么。 这个名字出自《爱丽丝镜中奇遇记》里的一句台词——"在这个世界里,你必须拼命地跑,才能留在原地。"用它命名这套框架,再贴切不过了。 过去二十年,AI能力提升的路径大致是这样:人类标注员打标签 → 模型学习 → 人类设定评估基准 → 模型优化。整个过程里,人类始终是那个"外部驱动力"。模型不会自己设定目标,不会自己评估自己,更不会自己给自己"加难度"。 "红皇后哥德尔机"把这个逻辑彻底翻了过来。 它让AI在博弈式训练环境中,自发生成一个"考官"角色——这个考官不断设计更严苛的审查标准、更难的任务场景,来挑战当前版本的模型。模型必须通过"考官"的测试才能存活,失败则被淘汰。而每一次成功通过,新的经验又被用来训练更强大的"考官",形成永无止境的螺旋进化。 |
用一个通俗的比喻:以前是人类当老师,AI当学生。现在AI既当学生也当老师,甚至这个"老师"还越来越严格。最终,"学生"的能力会超过任何人类老师能教的内容。 ——这才是"年度最危险论文"的由来 |
研究人员在论文中披露的结果令人侧目:这套框架下,AI的代码通过率和论文接收率实现了"翻倍级提升"。更关键的是,这套系统在理论上可以无限运行——没有天花板。 |
二2028年,AI可能不再需要人类研究员 |
如果你觉得"红皇后哥德尔机"已经够激进,那Anthropic联合创始人Jack Clark的判断会让你重新思考"激进"的含义。 6月28日,Clark在阿斯彭研究所的活动中给出了极为具体的时间表。他说:到2028年底之前,递归自我改进(RSI)很可能成真——到时候,AI将自主发明并构建出比自己更强的下一代模型,整个过程无任何人类研究员参与。 他甚至给了一个产品的具象画面:Claude 10将是这一时间节点上的产物——一个由AI自己设计、自己训练、自己构建的AI。 请注意,Clark不是在做某种哲学讨论。他把自己的置信度打到了60%。这是工程判断,不是科幻想象。 把"红皇后哥德尔机"和Clark的预测放在一起读,你会发现它们形成了完美的互文:英伟达和剑桥在论文层面证明了"自我进化"可行,Clark则在产品路线图层面给出了"自我进化"的时间表。这不是巧合——AI的下一波能力跃迁,不会来自堆更多GPU、烧更多算力,而是来自AI自己学会"怎么让自己变强"。 |
如果这个判断成立,那我们现在讨论的"AI取代人类工作"可能只是序曲。真正的大叙事是:AI将要取代人类研究员,来设计下一代的AI。 |
三"AI中间商"值20亿美元:商业模式正在被重新定义 |
讲完技术层面的变化,把视角转向商业。 6月29日凌晨,一家叫"演语科技"的公司宣布完成近3亿美元B+轮融资,投后估值突破20亿美元,成为国内AI应用领域的新晋独角兽。领投方是Granite Asia、腾讯、顺为资本。 这家公司的商业模式很有意思——它不做大模型,不做底座技术,不做底层架构。旗下拳头产品叫Liblib,核心能力只有一个:把市面上主流的视频生成模型、图像生成模型聚合到一个调度平台上,面向设计师和内容创作者提供一站式服务。 说白了,它是个"AI中间商",赚的是"算力差价"和"工作流服务费"。 这个模式过去不太被看好。理由很直接——如果大模型本身迭代得越来越强、越来越便宜,靠"聚合别人模型"吃饭的中间商还有什么议价权?上游降一次价,中间商的利润池就缩水一圈。 但资本市场正在重新审视这个判断。原因不难理解:大模型迭代速度在加快,单一模型随时可能被下一版覆盖。对于大量中小企业和创作者来说,与其孤注一掷绑定某个模型,不如通过一个调度平台,始终用"当前最强的模型"——哪怕这意味着支付一个溢价。 |
AI中间商的本质是什么?本质是"替客户承担模型选型和切换的风险"。而风险定价,从来都是一门好生意。 |
这给了一个很重要的启示:AI产业的商业机会,不只在"造轮子"的人手里,也在"帮别人选轮子"的人手里。 |
四DeepSeek:从"技术实验室"到"全栈商业体" |
如果说Liblib代表AI应用层的模式创新,那DeepSeek的故事则代表了AI底座层的范式跃迁。 6月16日,DeepSeek完成创立以来首轮外部融资。融资规模约510亿元(相当于74亿美元),企业估值逼近4000亿元。这是中国AI史上最大的一笔单轮融资。 但这笔融资更值得关注的不是数字本身,而是背后的结构设计。 创始人梁文锋个人出资200亿元,成为最大单一出资方。外部投资者——包括腾讯、宁德时代、京东、网易、IDG资本等——的资金不是直接投向DeepSeek公司,而是注入梁文锋管理的有限合伙企业。这意味着外部投资者只享有经济权益,不介入公司决策流程。同时,所有投资者被设置了五年锁定期。 这个结构设计的目的非常明确:筛选长期资本,排除投机者,确保创始人对公司的绝对控制权。在市场普遍诟病"创始人被资本绑架"的当下,DeepSeek走出了一条完全不同的路。 拿到钱之后做什么?两个信号很明确。 第一,大规模招聘。DeepSeek正在从一家"技术极客工作室"向"全栈商业实体"转型。第二,技术加速。6月中旬,DeepSeek推出推理加速框架DSpark,通过"置信度调度"等技术实现吞吐量大幅提升。这意味着行业竞争正在从"卷算力"转向"卷效率"——用更少的资源跑出更大的产出。 把DeepSeek融资放在更大的图景里看:从国家数据局发布数据赋能AI的系统方案,到科创板为未盈利大模型企业开辟上市通道,再到资本市场上智谱市值突破万亿港元——2026年6月的中国AI产业,正在完成一场从"技术长跑"到"制度护航"的成人礼。 |
五2880万次交互:中美AI的首次公开交锋 |
最后一条,表面看是一起商业纠纷,本质上是一场叙事权争夺战。 6月底,路透社和《华尔街日报》先后披露:Anthropic已正式向美国参议员和白宫官员提交材料,指控阿里通义千问模型在4月至6月期间,通过大约25000个虚假账号,与Claude进行了约2880万次交互,目的是"蒸馏"Claude的能力。 Anthropic的公开声明措辞强硬,称此类行为"违反其服务条款",并强调"定义权、解释权、合法性"是下一代AI竞争的核心。换句话说,它不仅仅在说"你偷了我的能力",更在说"判断谁对谁错的规则,应该由我来制定"。 这件事的争议点很复杂。一个模型通过另一个模型的输出来"学习",在技术上到底算"抄袭"还是"学习"?边界在哪里?人类通过阅读书籍学习知识,AI通过"阅读"另一个AI的输出学习能力——这两件事的差别在哪里? |
Anthropic的逻辑是:我用人类数据训练出来的闭源模型,你用虚假账号绕过了使用条款,成规模地获取我的输出用于训练,这就是对知识产权的侵犯。 反对者则说:如果"学习别人的输出"算侵权,那整个大模型行业从一开始就不合法,因为每一个模型在训练时都"消费"了大量人类创作者的作品。 |
这个问题目前没有共识。但它注定不会停留在Anthropic和阿里之间。它将是中美AI产业接下来无法回避的结构性矛盾——当一个国家最强的闭源模型被另一个国家最强的开源模型"蒸馏",到底谁来定义"合理使用"的边界? |
把这5件事串起来,你看到的不是一个简单的"新闻汇编",而是一条清晰的逻辑线: AI正在学会"自己教自己"(红皇后哥德尔机),而它教出来的下一代模型可能完全由AI自主构建(RSI预测);当技术能力逼近临界点时,商业模式也在发生根本性的重构(AI中间商崛起);底座层的竞争从"比谁钱多"转向"比谁效率高"(DeepSeek转型);而地缘层面的规则制定权争夺也在同一时间激烈上演(Anthropic诉阿里蒸馏事件)。 技术、商业、制度、地缘——四重线索在6月最后一周同时发酵。 万联证券首席经济学家龙红亮的一句话值得记住:"人工智能前沿竞争,不仅是技术储备与人才之争,更是资本市场效率的较量。" 这场竞赛的终局,不属于估值最高的公司,也不属于参数最大的模型。而属于那些能在自我进化的技术洪流中站稳位置、将代码能力转化为真实商业闭环的参与者。 未来已来,只是分布不均。 |
夜雨聆风