由中国图象图形学学会(CSIG)文档图像分析与识别专业委员会发起的“多语言多民族文档智能技术及应用系列论坛”,将于2026年5月16日在河南安阳召开。
1、论坛简介
“多语言多民族文档智能技术及应用系列论坛”由中国图象图形学学会(CSIG)主办,CSIG文档图像分析与识别专业委员会发起,旨在人工智能技术重塑人类知识生产方式的当下,以“技术赋能与人文重构”为核心议题,汇聚计算机科学、人工智能等各领域专家,共同探讨大模型技术如何突破古籍处理的文本识别、语义理解、知识关联等瓶颈,推动中华优秀传统文化在数智时代的创造性转化。
会议特别邀请了领域内的多位知名专家学者带来精彩的主题报告:华南理工大学金连文教授、南开大学周宇教授、北京大学冯岩松教授、华中科技大学刘禹良教授、上海人工智能实验室青年科学家王斌、国家级青年人才宫辰教授、曲阜师范大学熊晶教授、安阳师范学院李邦副教授等各位专家将为与会者分享多语言多民族文档智能技术领域的最近进展与研究成果。
本次会议特别设置了“大模型技术及古籍文档智能处理应用实践”现场交流环节,旨在搭建开放而广阔的交流平台,为领域内的专家、学者、青年学生提供深入探讨与交流的机会,共同推动相关领域的发展。
我们诚挚邀请从事相关领域研究的学者、专家以及广大学生参与本次会议,期待在大会上与您相聚,共襄学术盛宴!
2、基本信息
报到时间:2026年05月15日(星期五)14:30-20:00
报到地点(住宿酒店):安阳华强诺华廷酒店
论坛时间:2026年05月16日(星期六)
论坛地点:安阳师范学院文博楼二楼会议室
主办单位:安阳师范学院、中国图象图形学学会
承办单位:安阳师范学院计算机与信息工程学院、文档图像分析与识别专委会
协办单位:郑州新思齐科技有限公司
3、会议议程

4、讲者介绍
报告人1 :金连文

报告题目:AI 驱动的古籍文化遗产数字化修复:从扩散模型到多模态大模型
摘要: 近年来,大语言模型(LLMs)技术取得了突破性进展,并在各垂直领域展现出巨大潜力,是迈向通用人工智能(AGI)的代表性技术之一。本报告我将简要介绍近年来基于AIGC和LLMs的古籍文档图像数字化修复一些研究进展,包基于扩散模型与文字先验的修复方法、基于OCR+MLLM方法、基于统一生成理解大模型的修复技术、训练数据构建方法等,并对AGI时代的古籍数字人文研究进行讨论和展望。
个人简介: 金连文,华南理工大学二级教授,兼任中国图象图形学学会副理事长、广东省图象图形学会理事长等职。在重要学术期刊及国际会议上发表论文300余篇(其中中科院SCI Q1期刊+CCF A类论文150+篇),Google Scholar论文被引用数20000余次,H-Index 76。2006年入选教育部“新世纪优秀人才”计划,2024年入选国际模式识别协会会士(IAPR Fellow)。获省部级科技奖5项(其中一等奖2项),获国际学术会议最佳论文奖4次。指导学生参加知名国际国内学术竞赛并荣获冠军20余次。
报告人2:周宇

报告题目: 从局部编辑到全局翻译:可视文本编辑与翻译技术
摘要: 随着视觉-语言多模态大模型的发展,可视文本编辑与翻译由分阶段流程逐步演进为融合文本编辑与跨语言翻译的端到端范式。报告以“从局部编辑到全局翻译:可视文本编辑与翻译技术”为主线,探讨从细粒度文本操控到整图语义转换的技术发展路径。在局部文本编辑层面:TextCtrl基于扩散模型,引入字形结构与视觉风格解耦的“风格-结构”先验,通过显式建模字形结构与细粒度风格特征,有效提升文本编辑过程中的渲染准确性与视觉一致性;StyleTextGen则进一步增强了对文本风格的建模能力,提出支持外部风格参考的风格条件控制机制,使模型不仅能够复用原图风格进行编辑,还能够根据外部参考实现跨语言、跨字体的风格迁移,提升了编辑任务的可控性与泛化能力。在全局图像翻译层面:IMTBench构建了覆盖多场景与多语言的真实评测基准,并提出融合翻译质量、图像质量与跨模态一致性的多维评估体系,系统揭示了当前统一多模态模型在复杂布局与低资源语言上的性能瓶颈;MMTIT-Bench进一步从建模范式上进行拓展,引入“认知-感知-推理”(CPR)框架,将视觉理解、文本解析与翻译推理过程统一建模,从而提升模型在复杂场景下的翻译准确性与过程可解释性。
个人简介: 周宇,南开大学计算机/密网学院教授、博导;北京中关村学院学院导师;中国图象图形学学会文档图像分析与识别专委会副秘书长、常务委员。研究方向为计算机视觉、多模态智能、具身智能及大模型等,近期聚焦于文档智能、多模态大模型与智能体、终身学习等主题。研发的场景文本提取系统、GUI Agent、特定目标检测系统、钓鱼网站检测系统等应用于多个国家部委及企业,发挥关键作用。在国内外高水平会议及期刊如CVPR/ICCV/NeurIPS/ICML/ICLR/IJCV/TMM等发表学术论文100余篇,其中在CCF-A类/SCI一区会议期刊发表论文60余篇(一作/通作40余篇),获得CCF-A类会议ACM MM 2021最佳论文提名奖(5/1942篇)。团队核心技术获得ICDAR 2025复杂版面文档图像端到端机器翻译冠军、CSIG 2022票据识别与分析挑战赛冠军、2020年“中国人工智能·多媒体信息识别技术竞赛”手写&印刷文本OCR两项高校组冠军、ICDAR ReST 2023印章主体文字检测第三名等近10项学术竞赛奖项。主持国家重点研发计划课题&子课题、国家自然科学基金面上&青年基金项目、国家部委重大工程课题、中国博士后科学基金、企业委托等项目/课题多项。
报告人3:冯岩松

报告题目: 大语言模型如何学习新语言?
摘要:大语言模型已在众多推理挑战性任务中展现出令人瞩目的能力。近期的研究甚至尝试通过“在线教授”词典和语法资料,帮助大语言模型学习理解从未见过的新语言。尽管这些尝试取得了翻译指标上的提升,但大语言模型是否能够真正理解并有效运用这些语法资料,仍值得我们深入探究。本次报告将聚焦大语言模型通过在线学习完成极低资源语言翻译的机制问题。我们以现有数据资源极其匮乏的壮语为主要研究对象,探索了大语言模型是如何通过在线学习运用语法规则提高极低资源语言翻译质量的。实验表明现有大语言模型在基于在线学习的低资源语言翻译场景中,仍难以准确解读并运用语法规则;而将语法规则进行形式化表示,可以显著提高大语言模型运用语法规则的有效性。
个人简介:北京大学王选计算机研究所副教授。主要研究方向包括自然语言处理、领域大语言模型构建、法律与人工智能。担任国际计算语言学学会ACL Rolling Review 高级执行编委、自然语言处理领域重要期刊Computational Linguistics执行编委,法律人工智能领域重要期刊Artificial Intelligence and Law编委,中国计算机学会自然语言处理专委会副秘书长,中国中文信息学会语言与知识计算专委会委员,多次担任自然语言处理、人工智能领域重要国际会议 ACL、EMNLP、NAACL、EACL、IJCAI等的(高级)领域主席。相关研究成果发表在 ACL、CL、EMNLP、TPAMI、AIJ 等领域重要会议和期刊上。作为项目负责人或项目骨干已承担多项国家自然科学基金项目、NSFC-RGC联合基金项目、科技部重点研发项目课题以及北京市自然科学基金、中央引导地方大模型专项课题等。
报告人4:宫辰

报告题目:面向非理想条件的深度网络压缩
摘要:深度模型压缩旨在将大型的深度神经网络压缩为轻量级、高性能的小型网络并保持其性能,从而推动计算机视觉及模式识别技术在嵌入式设备中的广泛应用。作为神经网络压缩的代表方法之一,知识蒸馏将大型网络视为教师,将小型网络视为学生,从而通过教师到学生的知识传输实现网络压缩。然而,在很多实际场景中,往往存在各种限制和非理想化情形,比如教师网络的训练数据和学生网络的应用场景数据分布不一致、教师网络的训练数据由于隐私问题不可获取等限制等等,从而导致目前主流的知识蒸馏方法无法很好地实施。为此,本报告主要探究如何在非理想条件下基于知识蒸馏实现模型压缩,并提出了跨域直接蒸馏、基于标签带噪搜集数据的无数据蒸馏等方法。相关工作发表于ICCV、ECCV、IEEE T-IP等国际权威期刊及会议。
个人简介:宫辰,教授、博导;入选中组部万人青拔、IET Fellow。主要研究方向为机器学习、模式识别。已在ACM/IEEE Transactions以及CCF A类会议上发表100余篇学术论文,谷歌引用11000+,H指数54;另有11项发明专利获得授权。目前担任国际权威期刊IEEE T-PAMI、IEEE T-IP、IEEE T-NNLS、IEEE T-CSVT、Neural Networks、Neural Processing Letters编委;ICML, ICLR, AAAI, IJCAI, ICDM, AISTATS等多个国际会议的领域主席(Area Chair)。主持国家自然科学基金重点项目、面上项目、上海市大模型专项等。获吴文俊人工智能优秀青年奖、CCF-IEEE青年科技奖、中国科协“青年人才托举工程”、中国电子学会自然科学二等奖、上海市自然科学二等奖、中国人工智能学会“优秀博士学位论文”奖等,并入选百度发布的全球华人AI青年学者榜单以及斯坦福大学发布的全球前2%顶尖科学家榜单(2021-2025)。
报告人5:刘禹良

报告题目: 多源异构文档数据治理与应用
摘要:随着大模型技术快速发展,文档数据作为重要的信息载体,其高效解析、精准抽取与有序治理已成为推动智能应用落地的重要基础。本报告围绕多源异构文档数据治理与应用展开,重点介绍非结构化文档解析技术的最新进展,并结合实际应用场景,展望多源异构文档数据治理未来向智能化演进的方向。
个人简介:刘禹良,华中科技大学人工智能与自动化学院教授、博导。入选国家级青年人才、AI 2000全球人工智能学者。主持国家自然科学基金面上/青年、企业/区域联合重点子课题、国家重点研发计划项目子课题等项目。研究方向聚焦文档图象智能,曾获ACL 2024最佳论文奖,奥林帕斯先锋奖。
报告人6:王斌

报告题目:MinerU——构筑大模型时代的文档数据基石
摘要:在大模型时代,文档既是 RAG 与 AI Agent 的核心知识源,也是通用智能尚未被充分挖掘的数据富矿。本报告以 MinerU 系列的演进为主线,梳理文档解析领域的三次飞跃:第一跃 · 工程范式(MinerU v1):以自研布局检测与公式识别打通端到端解析流程,两个月 GitHub Star 破万,成为开源社区事实标准。第二跃 · 模型范式(MinerU 2.5):二阶段解耦式多模态架构,以 1.2B 参数率先在 OmniDocBench 突破 90 分,超越 Gemini 2.5 Pro 与 Qwen2.5-VL-72B。第三跃 · 数据范式(MinerU 2.5-Pro):架构不变,纯以数据工程将 OmniDocBench 推至 95.69,以小两个数量级的参数量领先 Gemini 3 Pro、GPT-5 等通用大模型。从"工程拼装"到"模型能力"再到"数据驱动",MinerU 的每一次跨越都在拓展文档解析的能力边界。当 OpenClaw 等 AI 应用真正走进日常工作流,高质量的文档解析,正是这些上层智能体能否可靠落地的那块地基。
个人简介:王斌,上海人工智能实验室青年科学家,上海交通大学兼职博导,研究方向为多模态大模型与文档智能理解。 他是开源文档解析工具 MinerU 的研发负责人——GitHub Star 60k+,多次登顶GitHub Trending;团队提出的 OmniDocBench 已被 Gemini 3 Pro、GPT-5、Qwen、DeepSeek 等采纳为模型基础评测基准。在 CVPR、ICCV、NeurIPS 等顶会发表论文 50 余篇,谷歌学术引用5500+。
报告人7:熊晶

报告题目:大模型驱动的甲骨文辅助考释
摘要:计算机辅助甲骨文考释是甲骨文信息处理研究中极具挑战性的课题,大模型的强大推理能力为突破甲骨文考释瓶颈提供了有力的保障。甲骨文考释是当前仅靠感知智能无法胜任的任务之一,需要认知智能的介入。本报告将立足甲骨文专家考释的实际情况,充分考虑甲骨文考释的动态性,从大模型微调、RAG、知识增强、神经符号推理等多策略探索计算机辅助考释的新途径。以期为甲骨文专家提供大模型驱动的、可解释的考释线索。
个人简介:熊晶,男,博士,湖北黄冈人,2010年6月博士毕业于中国海洋大学计算机应用技术专业, 2020年9月至2022年8月在欧洲顶尖知识表示研究中心KRDB (Free University of Bozen-Bolzano)从事博士后研究,现为曲阜师范大学教授,硕士生导师,研究方向包括:知识图谱、甲骨文信息处理、过程挖掘等;CCF杰出会员,IEEE会员,ACM会员,中国图象图形学学会文档图像分析与识别专委会委员,人工智能学会知识工程与分布智能专委会委员;《西部素质教育》期刊编委、《Green Carbon》期刊青年编委;主持包含国家自然科学基金、教育部国家语委重点项目在内的各级项目10余项;发表学术论文70余篇,出版学术专著2部,主编全国高等院校云计算系列“十三五”规划教材1部,参编河南省“十四五”普通高等教育规划教材1部;授权国际发明专利1项、国家发明专利8项、实用新型专利2项、软件著作权5项;曾年获河南省科技进步二等奖(位8);曾获河南省自然科学优秀学术论文三等奖、河南省教育厅优秀科技论文一等奖多项;曾获河南省高校优秀共产党员、河南省高校科技创新人才、河南省高校青年骨干教师、“安阳青年五四”奖章、安阳市学术技术带头人等荣誉称号。
报告人8:李邦

报告题目:AI赋能甲骨学——从数据基础、入口性工作到综合研究
摘要:在人工智能快速发展的背景下,甲骨文不仅是中华文明早期文字的重要载体,也是检验机器能否理解复杂结构化符号系统的独特场景。本报告将围绕 AI 进入甲骨学研究的现实路径,梳理其从数据基础、入口性工作到综合研究的三个层次。第一层是数据基础:现有甲骨文智能研究所依赖的数据,仍较多建立在工具书整理成果之上,而工具书往往保留的是专家综合分析后的结果,尚不能完整反映真实研究过程,同时许多重要工具书和资料体系仍未充分数据化。第二层是入口性工作:检测、识别、检索、匹配、去噪与生成等任务,早期更多以算法问题的形式出现,而随着数据基础的逐步完善,其意义正日益回到服务研究者进入材料、整理材料与利用材料的实际需求之上。第三层是综合研究:校重、缀合、断代、部件分析、字形演化以及面向考释的多模态理解等任务表明,甲骨文研究本质上依赖多源材料、上下文关系与知识链条的综合分析,人工智能只有逐步参与这一过程,才能真正成为甲骨学研究的辅助力量。报告希望借此说明,AI赋能甲骨学的关键,不只是提升单项任务性能,而在于推动甲骨文研究由数字化整理进一步走向面向真实学术问题的智能化辅助。
个人简介:李邦,安阳师范学院特聘教授、硕士生导师、中原青年拔尖人才,长期从事人工智能与甲骨文信息处理交叉研究,研究方向包括甲骨文图像整理与校重、多模态数据集构建、字形检索与结构化理解、智能考释与甲骨文智能体等。他是“殷契文渊”甲骨文大数据平台核心建设者之一,持续推动甲骨文资料的数字化整合、关联组织与智能应用;近年来围绕甲骨图像整理、字符检索、上下文建模与语义分析等方向持续开展研究,相关成果发表于 ICCV、npj Heritage Science、Scientific Data 等会议与期刊,逐步形成了从数据、算法到平台应用的一体化研究路径。
5、会议注册、签到
本次会议无注册费。
您可以通过下方注册链接或者扫描二维码进行注册。
注册链接:
https://s.wenjuanjun.com/mp/pyba4zpmqs
注册二维码:

6、其它信息
会议地点:
安阳师范学院文博楼二楼会议室
会议联系人:
孙 华 13703726634
焦清局 15890786226
郭茹芳 17503991360
住宿酒店:
安阳华强诺华廷酒店(文峰区弦歌大道与中华路交叉口向东150米)
END
加入学会:
关注我们:
夜雨聆风