

近几周,AI 圈的关键词依然是“升级”和“开源”。从 Anthropic 推出 Claude Opus 4.8, Google 的数学大模型攻克埃尔德什难题,再到 Meta 生态中的生物大模型、Figma 的实时编辑能力,以及研究员开源的 AutoScientists,AI 正在同时沿着通用能力、科学研究和生产力工具三条路线快速推进 。
如果说前一阶段AI比拼的是模型上限,那么近期更值得注意的,是它在专业工作场景中的协作能力和执行能力正在被不断放大。

Anthropic 本周发布了 Claude Opus 4.8,这是 Opus 系列的新版本,官方称它在编码、agent 任务和专业工作能力上都有提升,并且仍然保持同样的价格 。根据 Anthropic 的说明,Opus 4.8 面向的是更复杂、更高要求的任务,尤其适合软件工程、长链路 agent 工作流和高强度企业应用 。
Claude 版本对比
这次升级最值得关注的,不只是“更聪明”,而是“更能干活”。Anthropic 强调,Opus 4.8 在工具调用、长任务执行和可靠性方面都有改进,尤其适合需要持续多步推理、长时间协作和高自主执行的场景 。对开发者和企业用户来说,这意味着模型不再只是回答问题,而更像一个可以参与项目推进的协作对象 。
从产品策略看,Anthropic 依然在强化自己“高端生产力模型”的定位。Opus 4.8 不只是版本号上的更新,更像是朝着“可落地的 AI 工作伙伴”方向继续迈进 。

▍Google 数学大模型 AlphaProof Nexu:9个埃尔德什难题
Google DeepMind 的数学大模型 AlphaProof Nexus 这次带来的冲击很大:官方和相关报道显示,它成功解决了 9 个开放的埃尔德什难题,并证明了 44 个 OEIS 猜想,其中一些问题已经悬而未决 56 年 。更重要的是,这些结果是通过 Lean 形式化证明完成的,也就是说,它们不是“看起来像对的答案”,而是可以机器验证的严格证明 。
这件事的意义,远不止数学本身。它说明 AI 已经开始进入“可验证推理”的新阶段:不仅要会说,还要能在规则约束下给出严谨结果 。对于科研界来说,这种能力尤其重要,因为数学和理论科学最看重的就是逻辑正确性和可复现性 。
如果把这次突破放到更大的背景里看,它代表 AI 在科学发现上的角色正在变化。过去 AI 多被看作“辅助工具”,而现在它开始尝试直接参与高难度的开放问题求解,这会让未来的数学、计算机科学和基础研究出现新的协作模式 。

▍Meta 开源生物模型 ESM:蛋白质科学的"世界模型"
Meta 这次相关的热点是生物大模型 ESM 生态的开放进展。公开资料显示,Biohub 发布了围绕蛋白质生物学的开放发现引擎,包括 ESMC、ESMFold2 和 ESM Atlas,目标是为蛋白质结构预测、设计和生物发现提供统一基础 。其中,ESMC 被描述为在约 28 亿条蛋白质序列上训练得到的基础语言模型,用于理解蛋白质序列、结构和功能之间的关系 。

ESM 蛋白质模型这类模型的价值很直接:它把 AI 从通用文本世界,带进了生命科学这样高度专业的领域 。对科研人员来说,这意味着蛋白质结构预测、药物研发、分子设计和生物机制研究,都可能因为模型能力的提升而获得更快的探索速度 。
更值得关注的是“开源”这个动作本身。生物 AI 的壁垒一直很高,而开放模型和开放工具链,意味着更多实验室和研究团队可以直接使用这些能力,而不是只依赖少数头部机构 。这会加速生物 AI 的扩散,也可能推动新一轮科研协作方式的变化 。

▍Figma Make Now:设计与代码的边界彻底消失
Figma 这次更新的重点,是把 AI 和设计协作进一步绑定到生产环境里。官方介绍显示,Figma Make 新增了直接在生产代码中进行视觉编辑的能力,用户可以在设计界面里选中元素,调整布局、颜色、字体、尺寸等,系统再把这些改动映射到对应代码中 。这意味着设计师和开发者之间的协作链路被进一步缩短了 。

Figma 官方博客
这个更新的意义在于,Figma 正从“设计工具”变成“设计到代码”的协作平台 。过去设计稿和代码之间通常需要来回沟通、手动对齐、开发实现,而现在 AI 可以帮助自动定位相关代码并完成修改,减少重复劳动 。
对于产品团队来说,这类能力很实用,因为它不是在展示炫技式生成,而是在解决真实工作中的协作摩擦。尤其是在快速迭代的产品环境里,实时编辑、注释式提示和代码联动,会让设计与开发的边界变得更模糊,但效率更高 。

▍AutoScientists:哈佛团队开源"最强AI研究员"
AutoScientists 是这周很有代表性的研究型项目,它被描述为一个用于长期科研实验的分散式 AI agent 团队系统 。和传统“单个 agent 按固定流程执行任务”的方式不同,AutoScientists 的特点是让多个 agent 自组织成团队,围绕不同假设并行探索、互相批评、共享成功和失败,从而减少重复尝试并延续长时间的研究搜索 。
这类系统最重要的地方,不是“自动写论文”,而是开始尝试自动推进科研过程本身 。也就是说,它瞄准的不是单点回答,而是长期、复杂、迭代式的研究任务,这和真实科研非常接近 。
如果说大模型让 AI 有了“会说”的能力,那么 AutoScientists 这类项目,体现的是 AI 正在朝“会研究”方向发展 。这会影响的不只是 AI 研究本身,也可能影响材料、生命科学、计算化学和其他依赖大量实验探索的领域 。

▍结语
把这五个话题放在一起看,可以看到一个非常清晰的趋势:AI 正在从“通用对话能力”向“专业生产力”和“科研基础设施”两端同时延伸 。一端是 Anthropic 和 Figma 这样的产品,把 AI 更深地嵌入真实工作流;另一端是 Google 和 AutoScientists,把 AI 推向数学证明和科学研究这样的高门槛场景 。
这也意味着,未来判断一个 AI 产品是否有价值,可能不再只是看它能不能聊天,而是看它能不能真正参与任务、推进项目、减少人工重复劳动,并且在专业领域里持续产生可靠结果 。

Anthropic 官方公告 — Claude Opus 4.8:https://www.anthropic.com/news/claude-opus-4-8
arXiv 论文 — Advancing Mathematics Research with AI-Driven Formal Proof Search:https://arxiv.org/abs/2605.22763v1
Chan Zuckerberg Biohub 官方公告 — 蛋白质生物学世界模型:https://biohub.org/news/world-model-of-protein-biology/
ESM 蛋白质模型主页:https://biohub.ai/esm/protein/
Figma 官方博客 — Figma Make, Now on Your Local Code:https://www.figma.com/blog/figma-make-now-on-your-local-code/
AutoScientists GitHub 仓库:https://github.com/mims-harvard/AutoScientists
AutoScientists arXiv 论文:https://arxiv.org/abs/2605.28655
Let’s build real solutions with AI


一个关于AI实践的起点——InnoAI x HKU


夜雨聆风