“你用过豆包吗?”21岁的王世成用一个形象的比喻解释他最近完成的任务,“这次比赛就好比建立一个类似豆包的模型,然后让它把距今两千多年的古阿卡德语翻译成现代英语。”
2026年4月,这位重庆邮电大学人工智能学院2023级本科生王世成,与同学刘洋、美国IGS Energy公司算法工程师Jack Van Dyke组成的“M&J&M”团队,在全球顶级数据科学竞赛平台Kaggle举办的“古阿卡德语翻译挑战赛”中,从2673支队伍中脱颖而出,拿下金牌、全球第六,并成功闯入奖金区。王世成更凭借此前积累的“两金一银”,获评“Kaggle竞赛大师”称号,成为重庆首位获得这一全球顶级认证的本科生。
目前,全球仅约2266人获此殊荣,国内仅300余人。
与“脏数据”较量:金牌背后的笨功夫
本次比赛的任务,超出了常规结构化数据的范畴。选手需要利用有限的数据资源,训练AI模型将刻于泥板上的古阿卡德语翻译成英文——这属于典型的低资源古文字自然语言处理任务。
现存古阿卡德语文献仅约100本,竞赛虽然提供了约4000条文档(相当于30本书的体量),但参考资料依然匮乏。更棘手的是,古文字资料存在格式错乱、拼写误差等问题。

赛程中段,主办方对数据进行了一次更换,团队的成绩一度跌落到银牌区。复盘之后,他们把重心放在了一件看似“基础”的小事上——数据清洗。
“那段时间,我每天几乎花了十个小时在这件事情上,把一个个数据清洗成模型可用的形式。”队友刘洋回忆。王世成则形容这个过程“很磨人”:“你会感觉自己一直在做看不见分数上涨的工作,但后来证明,这些基础工作恰恰决定了最后的上限。”
团队创新性地将伪标签技术引入数据增强,让模型能把没见过的语句也纳入训练数据,有效推动核心指标实现了约15%的大幅跃升。团队分工明确:刘洋牵头负责数据体系搭建,美国工程师Jack Van Dyke专注于数据治理与修复,王世成则统筹模型实现、实验验证与策略调优,完成了从数据提取到多模型集成推理的全流程闭环。
“发现问题就改,效果不好就重做,分数卡住就换思路。”王世成用三句话概括了他们冲进前六的过程。
翻译完成后,团队还收获了一份意外的感动。“没想到几千年前的楔形文字里,竟记录着商队讲价、债务凭证这类日常琐事。”王世成说,这场技术挑战也让他们直观感受到了古代文明的脉搏。
两年三奖:一名本科生的“大师”晋级路
Kaggle竞赛大师的门槛,并非单场金牌即可触及。选手需要在多场国际顶级赛事中累计斩获一定数量的高阶奖项——具体而言,是“两金一银”。
王世成的“大师”之路,其实从大二就已起步。大二上学期,他首次在Kaggle赛事中获得银牌;下学期,再添一枚银牌。加上本次比赛的金牌,刚好达到授奖标准。
“这对于我来说,也是一个里程碑式的成就。”王世成说。
但很少有人知道,他最初接触学习时,也曾被数学公式和梯度推导“劝退”。“那时候高数还没学完,面对课程里很多东西确实觉得难。”他没有选择死磕理论,而是调整了方法——从一个具体的小项目入手,边实践边反推理论。
“先跑通,再优化,再复盘。”这是他反复强调的学习节奏,“很多时候成长就是先迈出第一步。不要总想着‘一口气学明白所有东西’。”
正是这种“先动手”的习惯,驱使他主动选择了Kaggle平台。“我希望把课堂上学到的东西真正拿到更复杂、更真实的场景里去检验。相比只在课程里做标准化的练习,我更想看看自己面对开放性问题时,能不能从数据清洗、特征构建、模型训练到最终推理,完整地把一个问题做下来。”
从大二到大三,从银牌到金牌,再到大师称号——这条路他走了将近两年。

“12字方针”背后:一个可复制的培养样本
王世成和刘洋都来自重庆邮电大学人工智能学院的数据科学与大数据技术拔尖创新班——20人小班教学,有一套著名的“12字方针”:笃志促学、课赛赋能、校企共育。
学院副院长王进介绍,拔尖班将Kaggle等高水平国际竞赛纳入实践教学核心环节,设定了“银牌必修、金牌培优”的考核机制——学生必须拿到银牌以上成绩才能获得相应学分。“技术拔尖班不追求学分数量,而是把时间留给实战与竞赛。学生从大一起就泡在数据与模型中,对接互联网大厂真实需求,培养‘上手就能用’的算法人才。”
这套模式的效果已经得到验证:2019级试点班的学生,今年硕士毕业后,40%进入AI头部企业担任算法工程师,班级平均年薪达到43.2万元,最高超过80万元。2021级拔尖创新班升学率100%,保研率63.6%;2022级保研率更是达到91.7%。而王世成和刘洋,已经收到了腾讯、华为、美团等多家头部企业的实习邀请。目前,王世成正在中国电信人工智能研究院实习,尝试把赛场技术落地到真实产业场景。
当被问及拿到“Kaggle竞赛大师”这份荣誉的感受时,王世成的回答出奇冷静:“惊喜、感恩,也更加清醒。”他说,这次比赛让他真正体会到,顶级竞赛比拼的不是单一模型或一两个技巧,而是对数据、训练、推理、工程实现和团队协作的系统性理解。“这个荣誉对我来说不是终点,更像是一个新的起点。”
对于想走同样道路的学弟学妹,他的建议很朴素:“先开始,比什么都重要。不要因为觉得自己还不够强就迟迟不敢上场。真正拉开差距的,不是起点有多高,而是有没有一直走下去。”
从与“脏数据”较量的日夜,到两年三奖的积累,再到一套被反复验证的培养路径——王世成的故事里没有天才式的横空出世,有的只是一个年轻人“先动手再说”的朴素坚持。而他本人,已经将目光投向更远的方向:“金牌不是终点,而是深耕自然语言处理的新起点。”
文字:李诗韵
编辑:杨怡枭
重庆经济技术开发区管理委员会出品
夜雨聆风