乐于分享
好东西不私藏

北理工计算机学院智能软件工程团队获 CCF-A 类顶级会议 ICSE 2026 杰出论文奖

北理工计算机学院智能软件工程团队获 CCF-A 类顶级会议 ICSE 2026 杰出论文奖

北理工计算机学院, 你关注了吗

智能软件工程团队获

ICSE 2026 杰出论文奖

北京理工大学

计算机学院

近日,软件工程领域旗舰级会议、国际软件工程大会 ICSE 2026 在巴西里约热内卢召开。北京理工大学计算机学院张宇霞副教授、刘辉教授团队发表的学术论文 “Evaluating Generated Commit Messages with Large Language Models” 荣获本届会议的 ACM SIGSOFT 杰出论文奖(Distinguished Paper Award)。

CCF-A 类顶级会议:ICSE

ICSE全称 International Conference on Software Engineering,是软件工程领域最有影响力、历史最悠久的旗舰学术会议,也是中国计算机学会推荐的 A 类国际学术会议。ICSE 2026共收到 1469 篇有效投稿,最终接收 321 篇正式论文,杰出论文奖共授予 22 篇,授予率仅为录用论文的 6.9%,是投稿论文的 1.5%。

Evaluating Generated Commit Messages with Large Language Models

01

论文背景

代码提交信息(commit message)是描述代码变更的关键文本,在代码审查与维护中具有重要作用。但由于开发者缺乏撰写动力,提交信息质量普遍较低。尽管已有大量自动生成方法,主流评估指标(如BLEU、ROUGE-L)因提交信息存在“一对多语义映射”问题,难以准确反映质量,甚至与人工判断相悖,评估方法亟需改进。

02

论文贡献

本研究首次系统验证了利用大语言模型(LLM)直接评估提交信息质量的可行性。通过对多种模型与提示策略进行比较,发现最优配置在“变更内容(What)”与“变更原因(Why)”两个维度上,与人工评估的Spearman相关系数分别达到0.65和0.78,接近人类一致性水平。相比BLEU、ROUGE-L、METEOR等传统指标,LLM评估在两个维度上均显著更优。进一步从可复现性、鲁棒性与公平性角度验证了方法稳定性,为提交信息评估提供了新的理论与方法依据。

03

作者信息

曾群鸿,北京理工大学计算机学院硕士研究生,导师张宇霞副教授,研究方向为智能软件工程。

张宇霞,副教授,博士生导师。研究方向为智能软件开发与开源生态可持续,在 TSE、ICSE、FSE 等高水平会议和期刊上发表论文二十余篇,获得CCF自然科学二等奖以及三次ACM SIGSOFT杰出论文奖。

刘辉,教授,博士生导师,CCF 杰出会员,软件工程专委会秘书长。主要研究领域为智能化软件工程,承担国家自然科学基金重点项目,发表 CCF A 类论文五十余篇,获得北京市技术发明二等奖、CCF自然科学二等奖以及三次ACM SIGSOFT杰出论文奖。

责编 / 李蕴文

图文 / 计算机学院

排版 / 计算机学院研会新媒体中心

审核 / 周连景  包成刚

请长按右边二维码

北京理工大学

计算机学院公众号