AI前沿|数学推理、生物模型、设计工具、自主科研全面爆发

近几周，AI 圈的关键词依然是“升级”和“开源”。从 Anthropic 推出 Claude Opus 4.8， Google 的数学大模型攻克埃尔德什难题，再到 Meta 生态中的生物大模型、Figma 的实时编辑能力，以及研究员开源的 AutoScientists，AI 正在同时沿着通用能力、科学研究和生产力工具三条路线快速推进。
如果说前一阶段AI比拼的是模型上限，那么近期更值得注意的，是它在专业工作场景中的协作能力和执行能力正在被不断放大。

▍Claude Opus 4.8：更诚实、更强大的旗舰模型

Anthropic 本周发布了 Claude Opus 4.8，这是 Opus 系列的新版本，官方称它在编码、agent 任务和专业工作能力上都有提升，并且仍然保持同样的价格。根据 Anthropic 的说明，Opus 4.8 面向的是更复杂、更高要求的任务，尤其适合软件工程、长链路 agent 工作流和高强度企业应用。
Claude 版本对比
这次升级最值得关注的，不只是“更聪明”，而是“更能干活”。Anthropic 强调，Opus 4.8 在工具调用、长任务执行和可靠性方面都有改进，尤其适合需要持续多步推理、长时间协作和高自主执行的场景。对开发者和企业用户来说，这意味着模型不再只是回答问题，而更像一个可以参与项目推进的协作对象。
从产品策略看，Anthropic 依然在强化自己“高端生产力模型”的定位。Opus 4.8 不只是版本号上的更新，更像是朝着“可落地的 AI 工作伙伴”方向继续迈进。

▍Google 数学大模型 AlphaProof Nexu：9个埃尔德什难题

Google DeepMind 的数学大模型 AlphaProof Nexus 这次带来的冲击很大：官方和相关报道显示，它成功解决了 9 个开放的埃尔德什难题，并证明了 44 个 OEIS 猜想，其中一些问题已经悬而未决 56 年。更重要的是，这些结果是通过 Lean 形式化证明完成的，也就是说，它们不是“看起来像对的答案”，而是可以机器验证的严格证明。
这件事的意义，远不止数学本身。它说明 AI 已经开始进入“可验证推理”的新阶段：不仅要会说，还要能在规则约束下给出严谨结果。对于科研界来说，这种能力尤其重要，因为数学和理论科学最看重的就是逻辑正确性和可复现性。
如果把这次突破放到更大的背景里看，它代表 AI 在科学发现上的角色正在变化。过去 AI 多被看作“辅助工具”，而现在它开始尝试直接参与高难度的开放问题求解，这会让未来的数学、计算机科学和基础研究出现新的协作模式。

▍Meta 开源生物模型 ESM：蛋白质科学的"世界模型"

Meta 这次相关的热点是生物大模型 ESM 生态的开放进展。公开资料显示，Biohub 发布了围绕蛋白质生物学的开放发现引擎，包括 ESMC、ESMFold2 和 ESM Atlas，目标是为蛋白质结构预测、设计和生物发现提供统一基础。其中，ESMC 被描述为在约 28 亿条蛋白质序列上训练得到的基础语言模型，用于理解蛋白质序列、结构和功能之间的关系。

ESM 蛋白质模型
这类模型的价值很直接：它把 AI 从通用文本世界，带进了生命科学这样高度专业的领域。对科研人员来说，这意味着蛋白质结构预测、药物研发、分子设计和生物机制研究，都可能因为模型能力的提升而获得更快的探索速度。
更值得关注的是“开源”这个动作本身。生物 AI 的壁垒一直很高，而开放模型和开放工具链，意味着更多实验室和研究团队可以直接使用这些能力，而不是只依赖少数头部机构。这会加速生物 AI 的扩散，也可能推动新一轮科研协作方式的变化。

▍Figma Make Now：设计与代码的边界彻底消失

Figma 这次更新的重点，是把 AI 和设计协作进一步绑定到生产环境里。官方介绍显示，Figma Make 新增了直接在生产代码中进行视觉编辑的能力，用户可以在设计界面里选中元素，调整布局、颜色、字体、尺寸等，系统再把这些改动映射到对应代码中。这意味着设计师和开发者之间的协作链路被进一步缩短了。

Figma 官方博客

这个更新的意义在于，Figma 正从“设计工具”变成“设计到代码”的协作平台。过去设计稿和代码之间通常需要来回沟通、手动对齐、开发实现，而现在 AI 可以帮助自动定位相关代码并完成修改，减少重复劳动。

对于产品团队来说，这类能力很实用，因为它不是在展示炫技式生成，而是在解决真实工作中的协作摩擦。尤其是在快速迭代的产品环境里，实时编辑、注释式提示和代码联动，会让设计与开发的边界变得更模糊，但效率更高。

▍AutoScientists：哈佛团队开源"最强AI研究员"

AutoScientists 是这周很有代表性的研究型项目，它被描述为一个用于长期科研实验的分散式 AI agent 团队系统。和传统“单个 agent 按固定流程执行任务”的方式不同，AutoScientists 的特点是让多个 agent 自组织成团队，围绕不同假设并行探索、互相批评、共享成功和失败，从而减少重复尝试并延续长时间的研究搜索。
这类系统最重要的地方，不是“自动写论文”，而是开始尝试自动推进科研过程本身。也就是说，它瞄准的不是单点回答，而是长期、复杂、迭代式的研究任务，这和真实科研非常接近。
如果说大模型让 AI 有了“会说”的能力，那么 AutoScientists 这类项目，体现的是 AI 正在朝“会研究”方向发展。这会影响的不只是 AI 研究本身，也可能影响材料、生命科学、计算化学和其他依赖大量实验探索的领域。

▍结语

把这五个话题放在一起看，可以看到一个非常清晰的趋势：AI 正在从“通用对话能力”向“专业生产力”和“科研基础设施”两端同时延伸。一端是 Anthropic 和 Figma 这样的产品，把 AI 更深地嵌入真实工作流；另一端是 Google 和 AutoScientists，把 AI 推向数学证明和科学研究这样的高门槛场景。
这也意味着，未来判断一个 AI 产品是否有价值，可能不再只是看它能不能聊天，而是看它能不能真正参与任务、推进项目、减少人工重复劳动，并且在专业领域里持续产生可靠结果。
▍参考资料
Anthropic 官方公告 — Claude Opus 4.8：https://www.anthropic.com/news/claude-opus-4-8
arXiv 论文 — Advancing Mathematics Research with AI-Driven Formal Proof Search：https://arxiv.org/abs/2605.22763v1
Chan Zuckerberg Biohub 官方公告 — 蛋白质生物学世界模型：https://biohub.org/news/world-model-of-protein-biology/
ESM 蛋白质模型主页：https://biohub.ai/esm/protein/
Figma 官方博客 — Figma Make, Now on Your Local Code：https://www.figma.com/blog/figma-make-now-on-your-local-code/
AutoScientists GitHub 仓库：https://github.com/mims-harvard/AutoScientists
AutoScientists arXiv 论文：https://arxiv.org/abs/2605.28655

Let’s build real solutions with AI

一个关于AI实践的起点——InnoAI x HKU