可信AI|中国信通院“生成式人工智能模型应用幻觉评估”首批评测正式启动-夜雨聆风

可信AI|中国信通院“生成式人工智能模型应用幻觉评估”首批评测正式启动

近年来，生成式人工智能技术加速演进，相关模型应用已广泛渗透至办公协同、内容创作、智能问答、行业服务等多类场景。随着应用规模持续扩大，模型在事实准确性、来源忠实性、上下文一致性、指令遵循和复杂推理等方面的偏差，可能进一步引发错误信息传播、业务判断失准、用户误导、行业应用风险外溢等问题。

目前，中国信息通信研究院依托中国人工智能产业发展联盟（AIIA）安全治理委员会，联合多家单位完成《生成式人工智能模型应用幻觉评估框架》编制工作。现正式启动“生成式人工智能模型应用幻觉评估”评测工作，诚邀各相关单位积极报名参与！

评测维度

本评测以《生成式人工智能模型应用幻觉评估框架》为依据，构建覆盖事实准确性、来源忠实性、内部一致性、指令遵循能力、逻辑推理能力、不确定性的诚实表达与处理能力等核心维度的评估体系。评测过程中，综合参评产品的功能特征与实际应用场景，制定针对性的评估方案，结合技术测试、材料审查和专家评审等方式，对模型应用的幻觉水平进行评估。

评测流程

从即日起开启专项评测报名，拟于2026年8月完成本批次全部评测工作，欢迎有意向的企业、机构报名参评。

咨询联系人

马老师 15210139366（同微信）

陈老师 18500022046（同微信）