西交大团队用AI设计出比金刚石还硬的碳材料:LLM+机器学习势驱动发现超硬、高导热新型碳相

来源：ScienceAI
本文约2000字，建议阅读5分钟
在千万级碳结构中锁定兼具极端性能的候选者。

如果把材料科学比作一片宇宙，那么碳就是最复杂、也最难穷尽的一片星系。它可以以 sp、sp²、sp³ 三种杂化方式自由组合，理论上能形成近乎无限的结构空间——但人类真正发现的，只是极小一部分。

来自西安交通大学的研究团队，试图改变这一点：他们构建了一套以大语言模型（LLM）为核心的闭环框架，让 AI 不再只是「筛选结构」，而是主动「生成新材料」，并在物理约束下快速验证，从而系统性地拓展碳同素异形体的边界。

在这篇于 2026 年 3 月 9 日发布在《Applied Physics Letters》上的「LLM-driven discovery for carbon allotropes with bond-network entropy」里，研究团队展示了他们所发现的多种新型碳材料，包括：硬度超过金刚石的「C16_3」超硬相、具有极端热导各向异性的「炔-金刚石 C12」和「炔-六方金刚石 C8」。

论文链接：https://pubs.aip.org/aip/apl/article-abstract/128/10/102202/3382659/LLM-driven-discovery-for-carbon-allotropes-with

CrystaLLM 的新逻辑

传统碳结构发现依赖第一性原理计算（如DFT）与结构枚举，但这也意味着需要计算的可能的晶体结构数量是天文数字。在碳体系中，不同杂化态的组合（sp / sp² / sp³）可以形成从一维链（carbyne）到三维晶体（金刚石）的各种拓扑结构，但绝大多数仍停留在理论可能性中。

近年来，AI 的快速发展为解决这一问题提供了相当强劲的助力。2024 年，英国一组研究人员发布了 CrystaLLM：一种大型语言模型（LLM），能够利用文本模拟晶体结构。而在本次研究中，研究团队引入了一个新框架，利用CrystaLLM 生成候选碳同素异形体，并快速测试其稳定性和性质。

图 1：闭环 AI 驱动材料发现工作流程的示意图，整合了两个协同的主动学习循环。

研究团队所提出的是一套双循环主动学习框架。

第一循环（生成）：利用 CrystaLLM产生候选碳结构（每个晶胞最多 100 个原子）。这些候选结构首先被快速筛选（用 PINK 代码估算热导率、用 Phonopy 结合当前 MLP 评估动力学稳定性）。
第二循环（迭代与反馈）：通过迭代构建基于神经进化潜能（NEP）架构的通用 MLP 提供支持，确保整个势能面上的 DFT 级精度。

为了让 MLP 具备泛化能力，研究团队构建了一个覆盖极广的训练集，包含从 C₆₀ 富勒烯到一维碳链、二维石墨烯、三维金刚石的各种结构；不同杂化态的混合体系；极端力学状态（从 -400 GPa 的拉伸到超过 1000 GPa 的压缩）。

图 2：碳机器学习潜能的训练性能和数据集多样性。

训练好的 NEP 在能量、应力和原子力预测上与 DFT 基准高度吻合。应力预测范围覆盖了从 -400 GPa 到 1000 GPa 的极端区间，这在传统经验势中几乎不可能实现。

而 NEP 捕捉不同维度晶格动力学和杂化的能力也不容小觑。经六种代表性碳同素异体的声子色散关系的实验验证，NEP 对金刚石、石墨烯、BC8、C₄ 等多种碳同素异形体的声子谱预测与 DFT 几乎完全重合，无虚频，证明其能够准确描述不同杂化态下的晶格动力学。

结构定位

利用这套框架，团队生成了数千个候选结构，并从中筛选出一系列动力学稳定的新碳相。

图 3：突出同素异体的结构和电荷密度分布。

超硬相 C16_3：计算维氏硬度高达 103.3 GPa，超过金刚石的 96 GPa（实验值）。这意味着它可能成为一种新型超硬材料。
「炔-金刚石」系列（C12 和 C8）：通过将线性 sp 杂化碳链（-C≡C-）插入金刚石的 C-C 键中形成。它们展现出极端的热导各向异性——沿刚性骨架方向热导率极高，而在垂直平面内则因 sp 链的大幅度振动而显著降低。这种特性使其成为定向散热和柔性热界面材料的理想候选。
sp-sp²-sp³ 杂化 C12：一种同时包含三种杂化态的复杂结构。其 sp-sp² 网络中的π电子高度离域，赋予其金属导电性；同时，该结构还表现出罕见的负泊松比（拉长时横向膨胀），这在碳材料中极为少见。不过，该相在室温下动力学稳定性稍弱（仅稳定至约 100K），但其独特的性能组合为设计多功能材料提供了重要思路。

碳结构新发现

除开对新结构的探讨，团队还实际讨论了这些新型碳形式是否能在实验室中实际制造。他们的计算表明，这些结构的稳定性与已经被制造出来的其他碳材料（如富勒烯）相当。

他们认为，一些新形态可以通过既有的化学方法逐步构建，而最致密、最坚硬的结构则可能通过在极高压力下压缩合适的起始材料形成。

总体来看，这项工作证明了「LLM 生成 + MLP 评估 + 主动学习迭代」的闭环框架在材料发现中的巨大潜力。它不仅适用于碳，还可推广到其他元素体系。

相关链接：https://arxiv.org/html/2602.22706v1

https://phys.org/news/2026-03-ai-driven-framework-uncovers-carbon.html

编辑：文婧

关于我们

数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识，努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博：@数据派THU

微信视频号：数据派THU

今日头条：数据派THU