乐于分享
好东西不私藏

AI 简讯|谷歌发布算法智能体AlphaEvolve, OpenAI发布GPT-5.5

AI 简讯|谷歌发布算法智能体AlphaEvolve, OpenAI发布GPT-5.5

AI赋能网安创新

事件一、AlphaEvolve:谷歌DeepMind发布算法智能体

2026年4月18日,谷歌DeepMind在官网正式发布名为AlphaEvolve的算法智能体,该系统能够自主设计和优化高级算法,大幅降低人工编写算法的成本。AlphaEvolve通过与谷歌Gemini系列大模型的深度集成,将算法开发从“人类逐行编写”变为“AI自动进化”,并在多个高难度学科领域取得了突破性成果。根据媒体报道,该系统已在谷歌内部投入使用,优化了数据中心调度和TPU芯片设计,并在官网面向外部研究者和开发者开放申请。值得一提的是,谷歌在展示AlphaEvolve能力时,专⻔选择了困扰数学界超过300年的“亲吻数问题”——这道题的历史可以追溯到1694年,牛顿曾与学者就此问题进行辩论。AlphaEvolve的成功发布,标志着AI从“算法的执行者”向“算法的发明者”迈出了关键一步。

技术要点

AlphaEvolve采用了一种融合大语言模型与进化计算的新型技术架构。其核心设计包含五个模块化组件的协同运作:一是任务定义模块,明确优化目标和评估指标;二是大模型集成模块,以Gemini Flash和Gemini Pro构成双模型协同体系;三是创造性生成模块,将算法源码视为“基因组”,利用LLM作为“变异算子”进行持续改写和迭代;四是评估反馈模块,对每一代生成的候选算法进行自动化评估和筛选;五是分布式计算模块,支持大规模并行搜索以提升进化效率。

在实践中,AlphaEvolve已展现出强大的算法发现能力。它解决了“亲吻数问题”(见后面“延展知识”详细介绍)——在11维空间中发现了由593个外层球体组成的新结构,刷新了数学界记录。在矩阵乘法优化上,它改进了4×4复值矩阵乘法算法,仅需48次标量乘法,超越了1969年Strassen算法的记录。在算法优化层面,它能够优化AI模型训练,将Gemini核心计算效率提升23%,训练时间缩短1%,并在GPU底层指令优化方面实现了FlashAttention核心计算最高32.5%的加速。此外,AlphaEvolve还一次性改进了五个经典拉姆齐数的下界,打破了尘封十年的数学纪录——其关键在于通过一个统一的“元算法”(meta-algorithm)自动化生成搜索代码,而非针对每个问题单独设计算法。

重要性

  • AlphaEvolve的战略意义首先体现在对“算法生产效率”的根本性改⾰上。长期以来,高级算法设计高度依赖人类专家的直觉和经验积累,每一次突破往往耗费数十年的时间和精力。AlphaEvolve让AI开始“自己发明算法”,使算法的发现过程从“人工迭代”演进为“自动化进化搜索”。这种转变意味着:人类能够从中挣脱出重复搜索的低效劳动,聚焦于更高层次的创造性问题定义,而算法层面的⼤量试错和寻优工作可由AI系统24小时不间断地自主完成。

  • 在行业层面,AlphaEvolve对计算体系的优化能力已在谷歌内部得到验证——数据中心效率得到提升,平均回收了约0.7%的计算资源。这一表现表明,AI系统不仅可以通过提升算法效率来降低数据中心运营成本,还可反过来优化其底层计算基础设施,形成“AI训练AI、AI优化AI”的闭环。

  • 在科学研究层面,AlphaEvolve同时突破“亲吻数问题”、矩阵乘法纪录和拉姆齐数下界的事实,证明了AI在数学与理论计算机科学领域的实质性贡献能力,为科学发现范式带来了深远影响。正如DeepMind CEO Hassabis所言,这是“AI在数学领域的又一个重大里程碑”。

延展知识:什么是“亲吻数”

想象一下,你正坐在桌子旁,面前摆满了同样大小的硬币。如果你在桌子上放一枚硬币,然后让其他的硬币都紧贴着围在它四周,最多能围多少枚硬币呢?在数学的几何世界里,这个问题被称为“亲吻数”(Kissing Number)。更严谨的几何定义:在 n 维空间中,一个单位球体可以同时接触(即“亲吻”)多少个与其大小相同的球体,且这些球体互不重叠。

  • 1维空间(线段): 想象一根细绳上的小圆点。中间的一个点,左右各能碰到一个点。所以,1维的亲吻数是 2。

  • 2维空间(平面): 就像在桌面上摆硬币。如果你摆得足够紧凑,你会发现中心的硬币周围恰好能围住 6 枚硬币,形成一个漂亮的六边形花瓣状。

  • 3维空间(立体): 这就是著名的“牛顿-格雷格里争议”。1694年,牛顿认为最多只能放 12 个球,但他的对手格雷格里觉得 13 个也许也能挤进去。直到 250 多年后,数学家才严谨证明了牛顿是对的,3维亲吻数是 12。

人类数学家的天花板

目前,人类只确定了少数几个维度的精确亲吻数,除这些特例外,绝大多数维度下数学家仅能给出一个范围——已知至少可以放多少个(称为“下界”)和至多不能超过多少个(称为“上界”),而真正的准确值藏在这个“未知区间”中,可能有几十年的跨度都无法缩小。在刚刚过去的近50年里,32维以下的亲吻数构造问题仅有7次实质性进展,而且每一次突破几乎都是孤立的——运用截然不同的数学技巧,依赖完全不同的构造思路,在别的维度上根本无法复用。就连数学家中的顶尖人物——2022年菲尔兹奖得主玛丽娜·维亚佐夫斯卡,也是凭借解决了8维和24维的球体堆砌问题(亲吻数问题正是其局部形式)而获此殊荣。

维度 亲吻数 备注
1D
2
简单直接
2D
6
蜂窝结构
3D
12
牛顿是对的
4D
24
2003年才被最终证明
8D
240
特殊的E8晶格结构
24D
196,560
著名的“李奇晶格”(Leech Lattice)

AlphaEvolve在亲吻数问题上做了什么突破?

AlphaEvolve通过自动化的“进化式算法搜索”,在11维空间中将该维度亲吻数的下界从592提升到593——这意味着,在11维的抽象空间里,原来数学家只知道“至少能放入592颗外围球”,而AlphaEvolve用算法证明“至少能放入593颗”。

单从数字上看,这只是增加了1个球的差别,但背后的意义远超数字本身。IEEE Spectrum在报道中指出,11维亲吻数的上界目前已知是868,所以从592到593看似只是将未知区间由276个缩小到275个,算不上颠覆性数字跳跃,但此举代表了AI系统首次在高维组合几何领域做出原创性数学发现,直接挑战了此前“大语言模型不具备原创科学能力”的论断

更重要的是,AlphaEvolve所做的并非简单地在超算上暴力枚举——那样的计算量在11维空间中根本不可行。它采用“进化搜索”机制:将算法源码视为可进化的基因组,利用大语言模型作为变异算子,结合分布式计算进行迭代筛选,自动寻找到人类此前从未设想过的球体排列构型。

事件二、GPT-5.5:OpenAI发布新一代大模型

2026年4月23日(美国当地时间),OpenAI正式发布其最新旗舰AI模型GPT-5.5。OpenAI总裁格雷格·布罗克曼将其定义为企业历史上“最智能、最直观”的模型,官方定位为“一种面向实际工作和智能体的新型模型”。相较上一个版本GPT-5.4,GPT-5.5在智能体编程(Agentic Coding)、计算机使用及深度科学研究领域表现卓越,能在完成相同任务的情况下显著减少Token消耗,打破了“模型更大—延迟更高”的传统法则。此次发布会还与英伟达展开了前所未有的深度合作:GPT-5.5与英伟达GB200、GB300 NVL72系统实现了联合设计,模型与硬件从训练到部署实现了深度协同优化。OpenAI总裁亲自分享了与英伟达CEO黄仁勋的交流邮件。目前GPT-5.5已在ChatGPT、Codex中向Plus、Pro、Business和Enterprise用户开放,API接口即将上线。

技术要点

  • 在智能体能力上,GPT-5.5能够自主完成多步骤、复杂层次的模糊任务。用户只需下达一个模糊的多部分指令(例如“找到系统中的bug并修复它”),模型即可自主规划任务步骤、调用相关工具、检查各步骤结果,并持续推进直至任务完成。在真实场景测试中,一家初创公司的CEO将实际代码库中的一个bug交由一位顶尖工程师重构,然后将同样的任务交给GPT-5.5完成——GPT-5.4无法做到的任务,GPT-5.5成功做到了。

  • 在性能效率上,GPT-5.5实现了历史上罕见的“更且更高效”的迭代突破。其逐Token延迟与GPT-5.4基本持平,但完成相同任务所需的Token显著减少。在Terminal-Bench 2.0测试中,GPT-5.5取得82.7%的准确率,大幅领先GPT-5.4的75.1%和Claude Opus 4.7的69.4%。在与英伟达GB200 NVL72系统协同配合下,相较前代系统,百万Token成本降低至35分之一,每兆瓦Token输出量提升50倍。

  • 在安全保障上,OpenAI强调GPT-5.5搭载了其史以来“最强有力的防护机制,设计了更严格的安全防护措施来锁定敏感数据,同时降低经验证的网络安全团队的访问门槛。GPT-5.5针对生物和网络领域误用采取了针对性的防护策略。据媒体报道,GPT-5.5的API部署将采取“不同的安全防护机制”,OpenAI正积极与合作伙伴和客户紧密配合,共同满足大规模部署场景的安全合规要求。

重要性

  • AI Agent能力从实验走向实际生产。过去AI在类似Agent任务上往往处于“逐步骤指导”阶段,开发者需要将任务拆解为数十个精细的prompt才能完成完整流程。GPT-5.5将概念清晰度从“理解指令”推进到“理解问题后自主决策”。这种从“调工具”到“自主规划—执行—检查—纠错”的质变,使AI Agent首次具备在企业环境中接管成熟工作流的信任基础。

  • “硬件—算法全栈协同”的竞争格局形成。GPT-5.5与英伟达GB200、GB300 NVL72系统的联合设计模式向行业表明:AI竞赛不再单纯是大模型参数规模之争,而已进入大模型训练框架和底层算力基础设施协同设计的深层对抗阶段。这预示着未来技术壁垒将从软件模型延展至“软硬一体”的全栈工程能力,资源不足的参与者将面临更高门槛。

  • “Agent安全的责任边界”进入监管和法律视野。自发布了有史以来最强的防护机制,到强调API部署中的不同安全措施,再到OpenAI承认其模型尚未完全具备承担关键生物和网络安全责任的能力,这表明随着AI智能体在网络空间中的操作权限不断升格,AI责任归属、安全防护、误用检测和审计追踪等体系性能力已成为不可回避的产业议题。

山石网科是中国网络安全行业的技术创新领导厂商,由一批知名网络安全技术骨干于2007年创立,并以首批网络安全企业的身份,于2019年9月登陆科创板(股票简称:山石网科,股票代码:688030)。
现阶段,山石网科掌握30项自主研发核心技术,申请560多项国内外专利。山石网科于2019年起,积极布局信创领域,致力于推动国内信息技术创新,并于2021年正式启动安全芯片战略。2023年进行自研ASIC安全芯片的技术研发,旨在通过自主创新,为用户提供更高效、更安全的网络安全保障。目前,山石网科已形成了具备“全息、量化、智能、协同”四大技术特点的涉及基础设施安全、云安全、数据安全、应用安全、安全运营、工业互联网安全、信息技术应用创新、AI安全、安全服务、安全教育等10大类产品及服务,50余个行业和场景的完整解决方案。