乐于分享
好东西不私藏

可信AI|中国信通院“生成式人工智能模型应用幻觉评估”首批评测正式启动

可信AI|中国信通院“生成式人工智能模型应用幻觉评估”首批评测正式启动

近年来,生成式人工智能技术加速演进,相关模型应用已广泛渗透至办公协同、内容创作、智能问答、行业服务等多类场景。随着应用规模持续扩大,模型在事实准确性、来源忠实性、上下文一致性、指令遵循和复杂推理等方面的偏差,可能进一步引发错误信息传播、业务判断失准、用户误导、行业应用风险外溢等问题。

目前,中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合多家单位完成《生成式人工智能模型应用幻觉评估框架》编制工作。现正式启动“生成式人工智能模型应用幻觉评估”评测工作,诚邀各相关单位积极报名参与!

评测维度

本评测以《生成式人工智能模型应用幻觉评估框架》为依据,构建覆盖事实准确性、来源忠实性、内部一致性、指令遵循能力、逻辑推理能力、不确定性的诚实表达与处理能力等核心维度的评估体系。评测过程中,综合参评产品的功能特征与实际应用场景,制定针对性的评估方案,结合技术测试、材料审查和专家评审等方式,对模型应用的幻觉水平进行评估。

评测流程

从即日起开启专项评测报名,拟于2026年8月完成本批次全部评测工作,欢迎有意向的企业、机构报名参评。

咨询联系人

马老师  15210139366(同微信)

陈老师  18500022046(同微信)