
在2026年2月24-26日于美国加州Santa Clara召开的第24届USENIX文件与存储技术会议 (USENIX FAST'26)上,上海交通大学计算机学院并行与分布式系统研究所(IPADS)的一项关于生成式文件系统的研究(Sharpen the Spec, Cut the Code: A Case for Generative File System with SYSSPEC),从全球众多顶尖成果中脱颖而出,同时获得了“Erik Riedel最佳论文奖”(Erik Riedel Best Paper Award)以及“杰出技术成果奖”(Distinguished Artifact Award)。这篇论文也成为了USENIX FAST自2002年创办以来,历史首次同时获得最佳论文奖和杰出技术成果奖的论文。
USENIX FAST
USENIX FAST (USENIX Conference on File and Storage Technologies) 是国际文件系统和存储系统的顶级会议,也是中国计算机学会推荐的A类国际会议,在学术界和工业界拥有极为广泛的影响力。本次会议共有253篇投稿,接收44篇(接收率17.4%),选出“最佳论文奖”2篇;同时,选出“杰出技术成果奖”3篇,以表彰文章开源框架的高质量和高可复用性。本次颁奖的现场嘉宾为本届会议的程序委员会主席André Brinkmann和Philip Shilane。


最佳论文奖现场颁奖照片


杰出技术成果奖现场颁奖照片
成果介绍
该论文第一作者为上海交通大学计算机学院并行与分布式系统研究所(IPADS)2021级博士生柳清源,通讯作者为杜冬冬、夏虞斌、陈海波三位老师。
论文信息:
Qingyuan Liu, Mo Zou, Hengbin Zhang, Dong Du, Yubin Xia, Haibo Chen. Sharpen the Spec, Cut the Code: A Case for Generative File System with SYSSPEC.24th USENIX Conference on File and Storage Technologies, Santa Clara, CA, USA, February, 2026.
项目主页:
https://ipads.se.sjtu.edu.cn/projects/specfs
文件系统持续演进的开发与维护难题
软硬件的发展日新月异,驱动着文件系统持续演进,以支持新的存储介质和应用需求。然而,传统的开发模式让社区付出了高昂的开发成本。本文对Linux Ext4文件系统长达20年的演化历史进行了详细分析。分析显示,社区付出的努力一方面体现在需要引入大量代码以实现新的feature,另一方面则体现在大量的Bug修复和维护开销。为了减轻社区的努力,团队提出了“生成式文件系统(Generative File System)”范式:开发者仅需对文件系统进行设计,用高层次的规约(Specification)来定义系统的行为,并依赖大语言模型(LLM)根据规约来完成底层系统代码的自动生成。 然而,利用生成式文件系统范式生成鲁棒的系统代码,至少面临三大关键挑战。第一,缺乏关于描述程序功能的系统性方法论总结,使用任意的自然语言进行规约的编写容易产生语义的遗漏或歧义;第二,文件系统具有庞大的规模和复杂的架构,代码生成受到大模型上下文限制,可能产生依赖或兼容性问题。第三,大模型的能力具有不稳定性,例如存在模型幻觉等问题。
构建 SysSpec 框架:用结构化规约驱动代码生成与演进
为此,本工作提出了 SysSpec,一种生成式文件系统开发框架设计。其主要创新点包含以下三项关键技术:
1.SysSpec Specification: 受形式化方法启发的系统规约
SysSpec 的核心洞察在于,生成式文件系统和形式化验证具有高度相似性:生成式文件系统用规约来生成代码,而非验证代码。基于此,SysSpec大量参考了形式化验证的方法论。SysSpec 采取结构化的规约设计,借鉴了 Hoare 逻辑中的前/后置条件,以及并发验证中的 Rely-Guarantee(依赖-保证)机制,从功能(Functionality)、模块化(Modularity)和并发(Concurrency)三个维度精确定义了系统行为,有效弥合了语义鸿沟。
2.DAG-structured Spec Patch: 向后兼容的系统演进
SysSpec将新增/修改的规约抽象为有向无环图(DAG)结构的规约补丁,并基于DAG结构将规约补丁和原有规约进行原子化的合并,并保障了合并过程的向后兼容性。
3.SysSpec Toolchain: 基于验证循环的代码生成
团队设计了一套 LLM 智能体工具链,引入多智能体,将验证过程融入代码生成过程,实现基于验证循环的代码生成。该方法有效降低了大模型的幻觉,提高了系统规约和生成代码的一致性。
完整构建 SpecFS,大幅提升开发效率与可演进性
基于上述框架,研究团队完全使用SysSpec,成功构建了完整的并发文件系统 SpecFS。 团队进一步通过规约补丁,在 SpecFS 上额外实现了 10 个来自于 Linux Ext4 的新特性(如延迟分配 Delayed Allocation 等)。实际测试结果表明,完全由 SysSpec 生成的 SpecFS 在数百项回归测试中,达到了与人类手写的基准系统一致的正确性。同时,新范式下规约的代码量显著少于底层 C 代码量,显著提升开发效率(3-5×)。
本文作为生成式文件系统迈出的第一步,希望能够启发未来的相关工作,进行更深更远的拓展,从范式层面对文件系统软件的开发和演进方法进行重构,彻底将系统开发者从琐碎的底层代码实现和维护中解放出来。
来源 | 并行与分布式系统研究所

夜雨聆风