乐于分享
好东西不私藏

新加坡提出全球首个生成式AI测试国际标准,企业需要关注什么?

新加坡提出全球首个生成式AI测试国际标准,企业需要关注什么?

点击蓝字,关注我们

生成式人工智能正在快速进入企业应用。

从内容生产、客户服务,到数据分析与自动化流程,越来越多公司开始将AI技术嵌入业务之中。

但与此同时,一个现实问题也逐渐显现:

当企业同时使用不同AI系统时,如何评估它们的能力、安全性与可靠性?

近期,新加坡提出的一项新国际标准,

正试图回答这个问题。

01

新加坡提出全球首个生成式AI测试国际标准

4月20日,新加坡提出一项新的国际标准建议

——ISO/IEC 42119-8。

这一标准旨在为生成式人工智能系统建立统一的测试方法,由新加坡资讯通信媒体发展局(IMDA)与 新加坡企业发展局共同提出。为针对生成式人工智能(Generative AI)系统的测试方法。

这一建议是在 国际标准化组织(ISO)与 国际电工委员会(IEC)人工智能分技术委员会会议上提出讨论。

此图源自新加坡联合早报官方网站,

见https://www.zaobao.com.sg/realtime

会议于 2026年4月20日至24日 在新加坡举行。

这也是该会议首次在东南亚地区举办。

本次会议吸引了来自全球 35个国家和地区的标准机构,以及 250多名AI专家参与。

随着AI技术在各行业加速落地,如何确保AI系统安全、可靠并具备可验证性,正成为各国政府与企业共同关注的问题。在这一背景下,新加坡提出的这项标准,也被视为推动生成式AI测试规范化的重要一步。

02

新标准主要解决什么问题?

此次提出的 ISO/IEC 42119-8,核心目标是:

建立统一的生成式AI测试框架。

让不同AI系统之间的表现,

可以被更清晰地评估和比较。

在技术方法上,该标准主要围绕两类测试方式展开。

01

基准测试(Benchmarking)

基准测试主要用于评估AI模型的整体表现,例如:

  • 模型能力

  • 输出质量

  • 系统稳定性

通过建立统一的测试指标与评估方法,不同AI系统之间的能力可以进行更客观的比较。

这对于企业在选择或部署AI系统时,

具有重要参考价值。

02

红队测试(Red Teaming)

红队测试是一种模拟攻击的安全测试方式。通过主动寻找系统漏洞,来评估AI系统的安全性和稳定性。

例如:

  • 识别模型潜在漏洞

  • 评估系统安全风险

  • 测试系统在极端情况下的应对能力

在实际操作中,通常由负责模拟攻击的“红队”,与负责防御的“蓝队”进行对抗测试,从而发现系统中的潜在问题。

总体而言,该标准希望通过规范化测试方法,提高AI系统测试的:可重复性、可比性、可信度

从而帮助企业和用户更好地理解AI系统的表现,并增强对AI应用的信任。

03

新加坡近年来推动AI治理与标准化

值得注意的是,这项标准并不是突然出现的。

它是新加坡近年来持续推动AI治理与标准化工作的延伸。过去几年,新加坡逐步建立了一套较为完整的AI治理与测试体系。

2019年

推出国家级《人工智能治理框架》

(Model AI Governance Framework)

2022年

推出AI治理测试工具 AI Verify

2024年

发布生成式AI治理框架,

并推出大型语言模型测试工具

2025年

推动 ISO/IEC 42001 人工智能管理体系标准

在本地应用

2025年

推出 全球AI保障沙盒 

(Global AI Assurance Sandbox)

2026年

提出生成式AI测试国际标准 ISO/IEC 42119-8

从整体路径来看,

新加坡正在逐步建立一套完整体系:

AI治理框架 → 测试工具 → 管理认证 → 国际标准

通过这一体系,新加坡希望在推动AI创新的同时,也建立更具可信度的AI应用环境。

04

企业使用AI时,为什么需要关注这些标准?

随着生成式AI逐渐进入企业核心业务,越来越多公司开始在不同场景中部署AI系统,例如:

  • 内容生成

  • 客户服务

  • 数据分析

  • 自动化流程

在实际应用中,企业往往会同时使用多个AI系统。

这些系统可能来自不同技术供应商,也可能部署在不同平台。如果缺乏统一测试与评估标准,企业可能会面临一些现实问题:

  • 不同系统能力难以比较

  • AI风险难以评估

  • 合规要求不够清晰

统一的测试标准,可以帮助企业在部署AI系统时获得更加透明的信息。

对于企业而言,其价值主要体现在几个方面:

首先,可以更清晰地评估AI系统表现。

通过统一指标,企业能够了解不同AI系统在性能、安全性和稳定性方面的差异。

其次,可以更有效地管理AI风险。

系统性的测试,有助于提前发现潜在漏洞或不当输出风险。

同时,也有助于提升AI应用的透明度与可信度。

05

企业在新加坡部署AI时需要关注什么?

随着AI治理体系不断完善,企业在部署AI系统时,需要关注的因素也在逐渐增加。

例如:

AI风险管理机制

模型测试与评估流程

AI治理框架的应用

国际标准与认证要求

对于计划在新加坡开展AI业务或部署AI系统的企业来说,提前了解这些政策与标准,有助于减少技术落地过程中的不确定性。

结语

随着生成式人工智能在企业中的应用不断扩大,如何评估AI系统的能力、安全性与可靠性,正成为全球共同面对的问题。

从治理框架、测试工具,到管理认证与国际标准,

新加坡近年来持续推进AI治理体系建设,

也逐步形成了一套较为完整的制度框架。

此次提出生成式AI测试国际标准 ISO/IEC 42119-8

正是这一体系向国际层面延伸的重要一步。

对于企业而言,AI技术的应用不仅是技术问题,也越来越涉及风险管理、治理机制以及合规要求。

对于计划在新加坡开展AI业务或布局区域市场的企业来说,理解当地不断完善的AI治理与标准体系,将有助于更稳健地推进技术落地与业务发展。

新加坡最懂出海的企业服务专家。深耕行业二十余年,服务众多来自中国、东南亚及欧美地区的企业客户顺利拓展新加坡市场。

如果你也在考虑出海“下一步该怎么走”,不妨早点来看看新加坡。有时候,看清方向,比拼命奔跑更重要。

点击

阅读原文

查看更多