自ChatGPT问世以来,人工智能领域进入了新的时代,2025年春节国产大模型DeepSeek横空出世,突破ChatGPT的技术封锁,在国内掀起了AI应用热潮,政府、企业、高校纷纷引入DeepSeek,展现出AI广阔的应用前景。8月,国务院印发了《关于深入实施“人工智能+”行动的意见》,推动人工智能与经济社会各行业各领域广泛深度融合,档案工作作为典型的数据密集型与经验驱动型行业,拥有丰富的AI应用场景,从档案整理、开放鉴定到编研利用,AI正带来一场深刻的变革。然而,在对AI寄予厚望的同时,也必须清醒地认识到当前AI技术的本质,及其在理解和应用物理世界方面存在的根本局限性,更好应对AI在档案管理中的机遇与挑战。

当前AI赋能档案工作的应用场景
《“十四五”全国档案事业发展规划》提出,要“积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用”。在《推进机关数字档案室建设实施办法(试行)》要求中,鼓励人工智能等新技术应用,辅助实现更加智能的档案管理,重点推动人工智能技术同档案整理、鉴定、编研、利用、保存等业务的深度融合。近年来,国家档案局安排了大量有关人工智能应用研究的科技项目。这些要求和举措,对档案行业积极探索人工智能技术应用起到了引领和推动作用。档案行业对于人工智能技术的应用,主要集中在数据分析、深度学习、多模态检索、知识图谱、大语言模型等方面,场景涵盖档案工作的各个环节。人工智能在档案整理著录、开放审核、编研、检索、数据库构建、音像档案修复、业务咨询等应用中都取得了良好效果。在这些主要应用基础上,还有些档案部门在人工智能应用上拓展了业务广度和深度,构建“知识图谱+大模型”的应用,形成智能交互问答、数据管理、智能审校、档案查重等多个知识化应用场景。

AI的本质与其在档案管理应用的局限
尽管AI在档案行业智能化实践场景不断丰富,但同时也存在局限和隐患。其中AI“幻觉”行为在档案管理和服务决策中最为危险,当AI虚构出一个看似合理却完全错误的答案时,若盲目采信,恐将酿成严重后果。可见,必须要充分了解AI应用的局限。
AI的本质是数据拟合的强大“黑箱”。AI大模型是通过学习海量的标注数据,来捕捉输入与输出之间的关系,构建出一个复杂的非线性模型,用于预测、分类或生成新的数据,其底层技术本质上是一种强大的模式匹配和概率预测,而非对机理的真正理解。以图像识别为例,AI通过学习数百万张蝴蝶的图片,能够识别出新的蝴蝶图片,但这并不意味着AI“理解”了什么是蝴蝶,它只是学会了将图片中的像素模式关联到“蝴蝶”这个标签。同样,在档案整理中,AI用大量的文本类档案对机器进行训练,通过提取文本的关键信息和语义特征,找到文本属性与文本类别之间的关系,但它不理解档案来源、内容及形式特征,也不理解档案价值和保管期限之间的关系,只根据训练数据进行模式匹配。训练中,算法对数据进行分类,建立起语料库,让模型函数尽可能贴合已知的路线。经过大量迭代对比,形成功能强大的模型,从而实现档案的智能分类,但其内部机制对用户来说犹如“黑箱”,难以从中直接解读出清晰的物理含义。于是,当AI给出结果时,我们无法完全确定它是否真的正确。
数据驱动是导致AI“幻觉”的根源。当前的AI主要依赖于数据驱动,通过挖掘海量数据中的潜在关联关系,为那些难以建立解析模型的复杂问题提供解决方案。其分析结果仅能揭示数据层面的统计相关性,而无法揭示客观现象的本质因果关系。这种本质差异是AI在处理复杂问题时容易产生“幻觉”的原因,因此AI难以完全取代物理世界的传统方法。档案部门数据重要敏感、数据化周期长、获取难度大,无法从互联网或开放渠道获取海量样本,可用于训练AI模型的数据集有限,个别可能带有偏差,导致AI模型容易在训练时表现很好,但实际应用时效果变差。更严重的是,在基于不充分或不准确数据时,AI会给出编造的输出,即所谓的“幻觉”。这种幻觉效应可能表现为模型对从未遇见过的情况作出完全错误的预测。
AI的“局部智能”和“认知鸿沟”。AI在阅读理解、视觉推理等基准测试中的表现,已经逼近甚至在某些方面超越了人类水平。然而,当场景切换到数学竞赛、复杂决策等领域时,这些模型却暴露出明显的短板,出现基准测试的悖论。这种“局部智能”现象,揭示了当前大语言模型的局限性。它们虽然能够在特定的、大量数据支持的任务中表现出色,但在面对需要深度理解和逻辑推理的任务时,就显得力不从心。Meta首席AI科学家杨立昆在2025年达沃斯论坛上,强调了现有AI系统与人类在对物理世界认知上的巨大差距。他指出,人类通过不断的观察、实践和体验,积累了丰富的关于物理世界的直观理解,已经成为本能和直觉,能轻松应对各种现实场景及其变化。而当前最先进的AI系统,尽管经过数百万次训练,在掌握这些物理规律和客观变化的能力上,仍远落后于人类婴儿,存在物理世界的“认知鸿沟”。
AI的资源成本和安全风险。AI是由算法、算力和数据(算料)三大核心要素组成。国产DeepSeek以优秀的算法取得突破,但AI的训练和运行仍需要足够计算资源和海量数据支撑。一个大模型,往往需要使用数千甚至上万块GPU,消耗的电力成本、硬件成本巨大。同时,为了保证模型性能和服务质量,在部署和运维时,也需要投入高额成本,这对于许多档案部门来说是难以承受的负担,限制了大模型在更广泛场景中的应用推广。同时大模型的训练数据来源广泛,互联网生成的内容可能包含有害、歧视性或虚假信息,引发伦理争议和社会问题。大模型也可能成为黑客攻击的目标,被恶意篡改或利用,导致档案数据安全存在风险。

AI技术赋能档案管理的融合突破策略
国产DeepSeek的强大算法展现出赋能行业发展乃至颠覆行业格局的巨大潜力。虽然AI在实际应用中存在诸多制约因素,但随着“人工智能+”行动深入实施,AI正以前所未有的速度推动社会经济各领域变革发展。档案部门需要认真思考,探讨其未来发展方向和应用场景,突破当前AI黑箱化与知识融合不足的瓶颈。
夯实档案数据基础。档案数据是档案工作“利用好”的“原材料”,数据质量直接决定“资政育人”的效果,高质量数据是AI在档案管理中有效应用的前提。第一,建立档案领域专属的知识库,以提升模型对档案语境和管理规则的理解能力,确保其输出符合专业规范。第二,全面规范档案数据标准,完善档案数据开放制度,建立数据治理机制,最大限度减少噪声数据和事实性错误,提升档案数据服务能力和影响力。第三,保障档案数据安全,实行数据分层分类管理,进行数据清洗,数据实名使用,明确数据使用要求和规范,加强数据隐私保护等。第四,建立动态更新机制,确保模型能够基于最新数据生成分析结果,从而满足档案服务决策的时效性需求。第五,实施多源交叉验证,利用多渠道数据进行一致性校验,有效识别并修正模型偏差。通过这一系列措施,确保AI“学得真”“学得全”,在真实安全可靠的数据土壤中构建认知体系。
多元融合拓展应用场景。人工智能核心技术持续突破,不断拓展智能科学前沿。多模态融合逼近人类感知,视觉、语言、语音的跨模态交互成为技术热点,通过视觉基础模型和语言模型的联合训练,人工智能已能“理解”图像中的隐含语义,甚至生成符合物理规律的视频内容。具身智能领域,机器人通过融合视觉、触觉,基于反馈与强化学习,已能在复杂环境中动态决策。档案部门要聚焦各类业务需求,畅通协同机制,应以数字化转型思维来考虑扩展AI在档案工作的应用场景。面对大模型的诸多局限性,档案部门可以尝试将大模型与专业领域知识相结合,构建专业领域针对性的小模型,提升多模态理解和局部复杂推理等方面的能力。同时,小模型因在边缘设备上的低功耗、高响应优势,与云端大模型协同互补,推动中心化算力依赖向分布式智能拓展,可降低档案部门资源成本。
人机协同防范AI风险。人工智能与专家体系的融合应用,可为档案管理构建起“效率与安全并重”的智能决策体系。既要发挥AI的自动化效能辅助决策,更要确保人类专业判断始终处于决策核心位置的“人机协同”机制,是防范AI风险的核心防线。始终明确AI是助手而非决策者,AI可以完成繁琐的计算、方案初筛等工作,但最终确定方案的必须是人。还要构建人机协同的文化氛围,一方面,让档案工作人员了解AI的原理和局限,在结果异常时懂得质疑AI而非自己;另一方面,引导AI用户正确反馈模型问题及提供数据,促使AI模型不断优化。未来档案管理呈现人机协同的混合智能范式,档案工作人员负责定义设计目标与约束条件,人工智能系统在给定边界内进行高效方案探索与优化,并由人类专家对最终的输出结果进行审核。这种双智融合模式通过优势互补,既能激发创新,又可确保符合物理规律与行业规范,最终实现档案管理综合效能提升。同时,档案工作人员还要加强大模型应用全流程保密管理,严格制度执行,完善监管措施,统筹发展与安全,有效防范失泄密风险。
价值融合推动AI发展。人工智能的本质是“增强人类能力的工具”,若只追求效率最大化而不加约束,会导致技术发展背离“服务人类”的初衷,甚至引发社会冲突。因此,必须确保人工智能产业应用建立在合理的社会治理规范之上,推动人工智能社会治理与产业应用的价值融合,是确保技术发展既服务于经济增长,又保障社会公平的关键路径。AI更好地赋能档案管理,既要技术突破,更要加强伦理规范。档案工作姓党,具有政治属性,要立足党的初心使命和中华优秀传统文化,构建具有档案特色的AI伦理体系:一是做到“四个好”,深入挖掘档案中的历史价值和文化意义,为人工智能发展提供价值指引,推动技术从单纯追求效率的工具理性向兼顾伦理价值的全面发展转变。二是践行“两个服务”,将服务党和国家工作大局、服务人民群众设计为AI大模型的目标函数,建立健全训练机制,确保技术发展始终做到“两个服务”。三是弘扬“四个得以”,发挥基础性工作特点,积极推动技术开源、普惠发展,不断弥合智能鸿沟,更好地推动AI技术赋能档案管理的突破发展。

文章来源:《中国档案》2025年第11期
作者单位:国家档案局

欢迎点赞、转发、关注,
再点点“推荐”哦!
如需转载请留言♥
夜雨聆风