
来源:ScienceAI 本文约2000字,建议阅读5分钟 在千万级碳结构中锁定兼具极端性能的候选者。

如果把材料科学比作一片宇宙,那么碳就是最复杂、也最难穷尽的一片星系。它可以以 sp、sp²、sp³ 三种杂化方式自由组合,理论上能形成近乎无限的结构空间——但人类真正发现的,只是极小一部分。
来自西安交通大学的研究团队,试图改变这一点:他们构建了一套以大语言模型(LLM)为核心的闭环框架,让 AI 不再只是「筛选结构」,而是主动「生成新材料」,并在物理约束下快速验证,从而系统性地拓展碳同素异形体的边界。
在这篇于 2026 年 3 月 9 日发布在《Applied Physics Letters》上的「LLM-driven discovery for carbon allotropes with bond-network entropy」里,研究团队展示了他们所发现的多种新型碳材料,包括:硬度超过金刚石的「C16_3」超硬相、具有极端热导各向异性的「炔-金刚石 C12」和「炔-六方金刚石 C8」。

论文链接:https://pubs.aip.org/aip/apl/article-abstract/128/10/102202/3382659/LLM-driven-discovery-for-carbon-allotropes-with
CrystaLLM 的新逻辑
传统碳结构发现依赖第一性原理计算(如DFT)与结构枚举,但这也意味着需要计算的可能的晶体结构数量是天文数字。在碳体系中,不同杂化态的组合(sp / sp² / sp³)可以形成从一维链(carbyne)到三维晶体(金刚石)的各种拓扑结构,但绝大多数仍停留在理论可能性中。
近年来,AI 的快速发展为解决这一问题提供了相当强劲的助力。2024 年,英国一组研究人员发布了 CrystaLLM:一种大型语言模型(LLM),能够利用文本模拟晶体结构。而在本次研究中,研究团队引入了一个新框架,利用CrystaLLM 生成候选碳同素异形体,并快速测试其稳定性和性质。
图 1:闭环 AI 驱动材料发现工作流程的示意图,整合了两个协同的主动学习循环。
研究团队所提出的是一套双循环主动学习框架。
第一循环(生成):利用 CrystaLLM产生候选碳结构(每个晶胞最多 100 个原子)。这些候选结构首先被快速筛选(用 PINK 代码估算热导率、用 Phonopy 结合当前 MLP 评估动力学稳定性)。
第二循环(迭代与反馈):通过迭代构建基于神经进化潜能(NEP)架构的通用 MLP 提供支持,确保整个势能面上的 DFT 级精度。
为了让 MLP 具备泛化能力,研究团队构建了一个覆盖极广的训练集,包含从 C₆₀ 富勒烯到一维碳链、二维石墨烯、三维金刚石的各种结构;不同杂化态的混合体系;极端力学状态(从 -400 GPa 的拉伸到超过 1000 GPa 的压缩)。
图 2:碳机器学习潜能的训练性能和数据集多样性。
训练好的 NEP 在能量、应力和原子力预测上与 DFT 基准高度吻合。应力预测范围覆盖了从 -400 GPa 到 1000 GPa 的极端区间,这在传统经验势中几乎不可能实现。
而 NEP 捕捉不同维度晶格动力学和杂化的能力也不容小觑。经六种代表性碳同素异体的声子色散关系的实验验证,NEP 对金刚石、石墨烯、BC8、C₄ 等多种碳同素异形体的声子谱预测与 DFT 几乎完全重合,无虚频,证明其能够准确描述不同杂化态下的晶格动力学。
结构定位
利用这套框架,团队生成了数千个候选结构,并从中筛选出一系列动力学稳定的新碳相。
图 3:突出同素异体的结构和电荷密度分布。
超硬相 C16_3:计算维氏硬度高达 103.3 GPa,超过金刚石的 96 GPa(实验值)。这意味着它可能成为一种新型超硬材料。
「炔-金刚石」系列(C12 和 C8):通过将线性 sp 杂化碳链(-C≡C-)插入金刚石的 C-C 键中形成。它们展现出极端的热导各向异性——沿刚性骨架方向热导率极高,而在垂直平面内则因 sp 链的大幅度振动而显著降低。这种特性使其成为定向散热和柔性热界面材料的理想候选。
sp-sp²-sp³ 杂化 C12:一种同时包含三种杂化态的复杂结构。其 sp-sp² 网络中的π电子高度离域,赋予其金属导电性;同时,该结构还表现出罕见的负泊松比(拉长时横向膨胀),这在碳材料中极为少见。不过,该相在室温下动力学稳定性稍弱(仅稳定至约 100K),但其独特的性能组合为设计多功能材料提供了重要思路。
碳结构新发现
除开对新结构的探讨,团队还实际讨论了这些新型碳形式是否能在实验室中实际制造。他们的计算表明,这些结构的稳定性与已经被制造出来的其他碳材料(如富勒烯)相当。
他们认为,一些新形态可以通过既有的化学方法逐步构建,而最致密、最坚硬的结构则可能通过在极高压力下压缩合适的起始材料形成。
总体来看,这项工作证明了「LLM 生成 + MLP 评估 + 主动学习迭代」的闭环框架在材料发现中的巨大潜力。它不仅适用于碳,还可推广到其他元素体系。
编辑:文婧
关于我们
数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博:@数据派THU
微信视频号:数据派THU
今日头条:数据派THU
夜雨聆风