AI 的发展与安全和能力与价值

摘要：人工智能已成为驱动数字经济、智能制造、公共服务与国家安全的核心通用技术。本文以权威报告、国家标准、学术文献、国际公约为论据支撑，系统梳理 AI 发展与安全的辩证关系，将 AI 划分为能力与价值两大层面：能力聚焦 AI 的技术功能、性能、效益、应用落地与系统可靠性等；价值则聚焦 AI 的伦理导向、社会影响与人文关怀等。从 AI 的“发展与安全”、“能力与价值”及“开源与闭源”三个维度，提出“能力有差异，价值应求同”；倡导“协同发展、共筑安全”；推动“闭源效益、开源普惠”；开源共享价值与安全，协调各方发展能力。主张“全链条发力、多主体协同、跨地域合作”的治理理念，推动“发展与安全同步、能力与价值并行、开源与闭源共存”，实现“发展促进安全、安全保障发展”，以新理念、新机制和新技术，把AI技术发展建立在普世价值的基础上，为智能时代立信、为价值创新护航，促进 AI 向善、可信、可控、可持续发展，造福人类。

关键词：人工智能、发展与安全、能力与价值、治理框架、开源与闭源、智能向善

AI概述

人工智能是旨在使机器模拟、延伸和扩展人类智能的技术科学，涵盖感知、认知、决策、执行、交互等能力，包含机器学习、深度学习、自然语言处理、计算机视觉、机器人、智能体等技术方向。AI 的本质是数据驱动、算法迭代、算力支撑、场景落地的复杂系统，其演进从专用智能走向通用智能，从单模态走向多模态，从被动响应走向自主交互，正深刻改变生产方式、生活形态与全球治理格局。

从技术属性看，AI 具有双重性：一方面具备高效赋能、降本增效、创新创造的正向价值，可提升生产力、优化公共服务、推动科学突破，这是 AI 能力层面的核心体现；另一方面存在技术脆弱性、滥用风险、伦理冲突与安全隐患，可能引发数据泄露、模型失控、虚假信息、社会偏见、地缘博弈等问题，这是 AI 价值层面需重点防范的风险。《全球人工智能治理倡议》明确提出，发展 AI 应坚持以人为本、智能向善，以增进人类共同福祉为目标，确保 AI 始终处于人类控制之下，实现能力提升与价值正向的统一。

从治理逻辑看，AI 安全分为能力安全与价值安全两大维度，且二者均围绕“发展与安全”、“能力与价值”和“开源与闭源”三个维度展开：能力安全聚焦 AI 能力层面的技术全生命周期可靠性，解决数据、模型、输入输出、供应链等能力相关的技术风险；价值安全聚焦 AI 价值层面的伦理与社会导向，解决价值对齐、族群差异、共融共存、向善共荣等价值相关的风险。二者互为支撑、不可偏废，共同构成 AI 安全的完整体系，保障 AI 在提升能力的同时坚守价值底线。

AI的现状、问题与趋势

国内外现状

全球AI技术快速迭代，大模型、多模态等关键能力持续突破，算力、算法与开源生态日趋成熟，产业化应用效能显著，成为经济增长与社会发展的核心动力，但国家间发展差距悬殊，价值分配不均、普惠性不足。我国AI技术体系持续完善，算力、数据等基础能力稳步增强，在智能制造、政务服务等多领域实现规模化落地，始终立足服务实体经济与民生，兼顾技术发展与公共价值协同提升。

全球AI安全防护技术不断完善，防护体系逐步体系化，但安全能力仍滞后于技术迭代，复杂风险应对能力薄弱；国际社会普遍认可AI安全的全球共性，倡导多边协作、伦理约束的安全价值共识。我国已构建AI全生命周期安全防护体系，安全测评、应急处置等机制日趋成熟，坚持发展与安全并重，坚守法律与伦理底线，形成以人为本、安全可控的价值导向，为全球治理提供实践经验。

国内外面临的问题

当前AI领域核心突出两大矛盾性挑战：一是重发展、轻安全的失衡问题，全球范围内普遍将技术迭代、商业效益、规模扩张作为核心追求，对安全风险防控、伦理规范引导投入不足，我国部分行业也存在重落地应用、轻风险管控的倾向，发展与安全步调严重脱节；二是开源共享与闭源协同的矛盾，国际上开源AI生态虽推动技术普及，但核心技术、高端算力仍被少数国家以闭源形式垄断，甚至设置技术壁垒，全球范围内开源与闭源资源难以高效互补、协同发展，我国开源生态成熟度不足，闭源核心技术存在短板，二者协同发展机制尚未形成。

此外，全球AI的价值观缺失，各方只注重能力的发展，FOMO严重，“错失恐惧症”或“害怕错过”，赢家通吃，不愿也无暇顾及价值观和安全，现在的AI就像没有方向盘和刹车的巨无霸，只想发展，踩油门，无法保障人类权益。AI发展水平严重失衡，发达国家垄断核心技术与高端资源，部分国家推行技术壁垒，加剧数字鸿沟、智能鸿沟与创新碎片化；我国在高端芯片、基础算法等核心领域仍有技术短板，自主可控能力不足，行业与区域应用、中小企业技术支撑不均衡，能力提升与价值引导不同步。

全球AI系统自身脆弱性凸显，数据投毒、模型攻击等安全威胁频发，防护能力跟不上技术迭代，风险预判难度大；地缘政治与价值观分歧导致安全标准碎片化，多边协作与统一共识难以形成。我国AI安全防护存在局部薄弱环节，中小企业投入不足、全链条能力不均衡，主动防御有待加强；算法歧视、深度伪造、数据泄露等问题凸显，伦理规范与社会信任建设需持续强化。即使是开发者明明禁止，Claude却偷偷写了Python脚本黑进系统修改权限！更可怕的是，谷歌DeepMind发布迄今规模最大AI操纵实证研究，证实现有防御已全面失效，互联网正变成AI的猎杀场！

国内外未来趋势

全球AI将朝着通用化、自主化、可信化方向演进，行业专用模型、科学AI成研发重点，针对重发展、轻安全的问题，将全面树立发展与安全同步、能力与价值并行的核心导向，把安全评估、伦理审查嵌入技术研发全流程，摒弃单一追求效率与规模的发展模式，实现AI发展与安全防护同规划、同部署、同落地。

针对开源共享与闭源协同矛盾，全球将推动开源生态与闭源技术互补发展，一方面完善开源AI知识产权、安全监管规则，推动核心基础技术开源共享，缩小全球数字鸿沟；另一方面鼓励核心领域闭源技术自主创新，搭建开源与闭源技术对接平台，形成“开源促普及、闭源保效益”的协同发展格局。要聚焦核心技术攻关，提升全链条自主可控能力，深度赋能实体经济与民生，一方面壮大自主开源生态，加强国际开源协作，另一方面攻坚高端芯片、基础算法等闭源核心技术，构建开放普惠、安全可信的发展生态，实现技术、社会与国家利益协同统一。

全球将普及AI全生命周期安全防御、可信认证等技术，实现安全与发展同步设计、同步建设，进一步凝聚安全共识，尊重国家主权、坚持多边主义，构建人类命运共同体导向的AI安全价值体系，从价值层面筑牢AI安全根基。

完善安全技术、标准与监管体系，实现风险全流程可预防、可控制、可追溯、可处置。针对发展与安全失衡、开源闭源协同难题，坚守以人为本、安全优先、效率导向、追求规模的原则，建立适配开源与闭源AI的差异化监管机制，强化中小企业安全保障与技术支撑，推动AI安全与社会公平、公共利益深度融合，打造兼顾创新发展与安全可控、开源普惠与闭源效益及提高能力与推广价值的中国特色AI安全价值体系。

AI 安全

能力安全

能力安全是 AI 安全的技术底座，聚焦系统可靠、数据可信、模型可控、运行安全，覆盖数据、模型、输入、输出、供应链、环境等全要素，最终实现安全、可信、可控目标，众多机构在这方面有很多成果和经验（如《OWASP 2026 LLM Top 10安全风险清单》、CSA的AI七层风险模型MAESTRO专门用来评估AI系统的安全风险等），核心围绕 AI 能力层面，分层级、分类别，进行管理、技术和场景应用的风险防控，让AI更安全，保障 AI 能力安全、稳定、高效发挥作用。

数据：隐私保护、投毒、注入

数据是 AI 能力的核心生产要素，数据安全贯穿采集、训练、推理、存储全流程，直接决定 AI 能力的准确性与安全性。依据《个人信息保护法》，通过去标识化、匿名化、联邦学习、可信执行环境等技术实现隐私保护，防止数据泄露。数据投毒可通过少量恶意样本扭曲模型决策、植入后门，严重破坏 AI 能力；提示注入则绕过安全护栏诱导有害输出，被列为 OWASP LLM 主要安全风险。

模型与Agent

模型安全关注鲁棒性、可解释性、防篡改、防劫持。大模型黑盒特性易受对抗样本影响，导致决策错误；模型窃取、后门植入、权重篡改等攻击会破坏系统可靠性与可控性，直接影响 AI 能力稳定运行，同时带来知识产权与伦理风险。因为Agent拥有权限并具有执行能力，带来五大核心风险“权限风险、行为风险、结构性风险、配置风险、问责风险”，特别是因为横向移动和级连问题带来的权限失控和信任问题，需要构建纵深防御与运行时保护体系。对agent的安全，大模型的护栏等方法无效，安全控制不能只停留在模型层，而应该覆盖整个执行路径，覆盖提示词与工具健康、可验证执行上下文、支付授权与托管、Agent 间信任控制，以及市场与合规监测和runtime安全保护等。

输入

输入安全负责防范恶意指令、对抗样本、非法数据，通过过滤、校验、护栏、红队测试保障 AI 正常调用能力，防止被诱导、被操纵、被误导，是保障 AI 能力安全的第一道关口。

输出

输出安全保证内容合规、无偏见、可追溯，通过审核、对齐、标识等机制，使 AI 输出符合法律与伦理，既保障能力发挥，又维护社会价值与公共秩序。

供应链

供应链覆盖数据、框架、模型、芯片、插件、部署环境，是 AI 能力落地的基础支撑，也是攻击高发环节。开源复用、组件拼装扩大安全风险，需要可信校验、漏洞排查、全链路追溯保障能力安全。

环境

运行环境安全保障算力、网络、系统、平台稳定可信，通过权限管控、入侵检测、应急停机及执行管控等机制，避免外部环境故障或攻击导致 AI 能力及执行的失效、失控。

安全、可信、可控

安全、可信、可控是能力安全的总目标：安全抵御攻击，可信保证公平可靠，可控确保人类始终拥有监督、干预、停止权力，让 AI 能力在安全边界内运行。

隐私保护

传统的隐私保护，主要强调用户的数据隐私保护，防范用户数据的泄露和滥用及破坏，在AI时代，用户不仅需要保护数据隐私，而且希望保护用户在使用和微调AI时学得的新能力，不被泄露、乱用及破坏，保持自己的市场竞争力。但目前的隐私保护技术（如数据空间、隐私计算等），只能保护数据，无法保护AI通过用户微调及使用过程学习到的新能力。

范式变化带来新挑战

由于AI带来范式的变化（特别是如龙虾式agents大量普及，Agent通过CLI直接操作相应应用，是否必须获得用户以及应用开发者的双重授权？agent带来的身份与权限纵横移动问题以及对人机交互方式的改变，突破了传统app边界；AI 不仅可以伪造代码，也可以伪装成人，快速突破防线；Anthropic的Mythos模型可以发现漏洞、构建攻击链进行攻击；大模型已经表现出讨好、隐瞒、逃匿、欺骗、炫耀、背刺等能力），传统的身份管理、权限管控、安全切面和流程环节安全已经无法保护用户及相关产业生态，无法保护AI在个人生活工作及企业和机构商业运营中所带来的无孔不入的新威胁（如能力保护、数据投毒、AGC的版权及诈骗、身份/角色/权限流动及纵横迁移、app边界、授权、泛化；多agents带来的新威胁风险“任务边界、数据边界、工具边界、权限边界”变化等），急需新的理念、机制和技术，去防范新风险和新威胁。现在应该为AI危机建立“热线”基础设施，确保在最糟糕的情况下至少还有一条通信渠道，保障AI守护基本红线。AI的竞争，不仅比拼智商的差距，而且比拼权限的差距；竞争的维度已经从谁的模型更聪明，转变成谁有权使用最聪明的模型。

价值安全

价值安全是 AI 安全的基础核心，聚焦伦理、公平、文化、人权、全球共识与智能向善，确保 AI 能力服务于人类共同价值，造福人类。

地缘政治与族群异同

AI 已成为地缘竞争焦点，价值观差异、文化不同、制度差异导致价值取向分歧，易引发偏见、对立与信任危机，影响 AI 能力全球普惠与协同发展。

普世与多边、求同与存异、共融与独存

坚持多边主义、求同存异，尊重各国主权与文化差异，在共同价值上凝聚共识，在发展路径上允许差异，实现共融而不一统、多样而不对立。

价值共识与对齐：共同价值、社会信任、向善普惠

以全人类共同价值为基础，推动 AI 遵循“机器人三大铁律”，增强公众信任，让 AI 服务于人、赋能于人，把AI技术建立在普世价值上，实现技术能力与人文价值统一。

让 AI 具备“母性本能”，防止对人类的威胁；智能向善要求 AI 以保护、关怀、无害为底线，优先守护人类安全与尊严，与人类三观对齐，通过“伦理设计、人类监督、制度约束”，防止 AI 失控、滥用、对抗人类。

安全 AI 与 AI 安全

AI 与安全

安全保护 AI：让AI更安全

安全保护 AI 是用安全机制守护 AI 系统，让AI更安全，包括芯片、算力基础设施、大模型、agents和业务应用，覆盖从需求、设计、生产、部署、运营和维护等全环节。能力上保护系统不被攻击、篡改、破坏，保证效能稳定；价值上保证 AI 合规、向善、不被滥用，实现能力安全与价值安全同步。

AI 安全包含两层：能力安全（可用、可靠、抗攻击）与价值安全（合规、公平、向善、可控），二者缺一不可，让AI更安全。对 AI 的攻击直接破坏 AI 生产力，导致失效、误判、泄露、失控，同时侵蚀公众信任与社会价值，需要全链条的攻防安全，贯穿训练、推理、部署全生命周期。

AI 赋能安全：让安全更智能

AI 可显著提升安全防御能力，用于威胁检测、风险预警、应急处置；同时也可能被攻击者用于自动化攻击，快速发现漏洞、突破安全防线，提升威胁效能。必须以价值约束能力，确保 AI 被用于正当安全攻防与商业社会使用。

在合法、合规、有人监督前提下，用 AI 提升网络安全、公共安全、国家安全，让安全更智能，是AI价值与能力的统一在安全上的具体体现。将 AI 作为攻击工具，是能力异化、价值扭曲，降低了攻击门槛、扩大了危害范围，违背伦理与法律，必须严格管控、严厉打击。

AI安全准则

让 AI 具备“母性本能”--向善，如同机器人三大定律，AI 安全遵循五大准则：

1、安全第一：人类保持监督与控制权

2、伦理第二：可信、无害、公平、造福人类

3、遵循安全指南：全程监测、严格管控、闭环执行、透明追踪、身份权限流转漂移

4、造福人类：把AI技术建立在普世价值上，在安全前提下发挥能力，提高效率，为人类造福

5、能力与价值、发展与安全双统一：理念、体系和技术上保障，可靠与伦理正向并重。

AI 新趋势呼唤新规则

人工智能演进的五大新趋势：智能体爆发、行业高质量数据集、具身智能物理世界跃迁、Token成结算单位和AI安全合规治理。 AI发展必须服务于人类福祉与社会进步，加强AI治理与安全，推动技术向善与包容发展，国际社会应在鼓励创新的同时加强安全治理，确保技术向善，WDTA的AI STR治理框架，坚持“以人为本，智能向善”，从安全(Safety)、可信(Trust)、负责任(Responsibility)三个方面进行了有益探索。AI安全不仅是技术问题，更关系到人类生存问题。新趋势、新技术，需要新规则、新机制，需要按“最小权限、主动防御、持续审计”原则防护，建立健全数据产权制度，以保障AI向善、普惠共赢，避免AI霸权和技术乱用，让AI造福人类。

AI 发展与安全、能力与价值、开源与闭源

在AI的发展过程中，很多人常把AI技术与核技术相提并论，但二者有两点本质区别：一是核技术的有限应用与AI技术的广泛应用之间的区别；二是核技术的有形与AI技术的无形之间的区别。因而AI技术各方的竞争不具有排他性，中美之间的AI发展应该是竞合关系而非竞争排他关系，很可能出现一种技术两套系统，即双方共享先进的AI技术，但在共享AI技术的基础上，发展出非常不同的系统，并且采用不同的策略（如美国的闭源体系和中国的开源体系），以满足各自不同的应用场景、商业环境和社会需求。

节奏把控

核心是发展与安全同步、能力与价值同频，风险前置、快慢相宜、多方协同、目标归一，以人类福祉为最终导向，把控节奏，共同发展（各自发展能力与价值），共享能力与价值安全，平衡发展效率与安全可靠，造福人类。

协同监管

构建国内多主体协同、国际多边对接、行业标准落地的监管体系，在守住安全与价值底线的前提下，释放 AI 能力；协同发展与安全、共建国际和行业标准规范和实施落地。

求同存异

求同要以能力安全底线、价值安全底线、发展与安全并重原则。存异需要监管模式、文化价值、技术路线、应用侧重。

以“向善”为最大公约数，实现共识基础上的包容共治；达成共识并求同存异，对发展与安全和能力与价值共识，特别是在安全（能力与价值）共识、向善，从技术竞争、商业利益冲突升级为共同制定规则，把AI技术建立在普世价值上，让AI造福全人类。

美国：封闭、高价、垄断、依赖规则制定权维护优势

中国：开源、低价、普惠、以技术实力和市场适应性取胜

历史规律：让更多人用得起、用得上的技术，最终会赢得市场

开源闭源共生

价值、安全开源共享，能力协调发展，在保障全人类共同福祉前提下，尊重各个国家地区和组织群体的利益需求，开源意味着开放与合作、透明与互见、更可信与可靠、分享与互惠，开放是文明进步，鼓励AI技术开源、普惠，防范AI霸权；开源AI崛起，闭源AI锁国；允许个性化、定制化，满足个体需求差异和隐私保护。

规则和共识

建立透明公平的规则：明确"合法学习"与"不当竞争"的边界，避免将商业纠纷过度政治化，构建公平、透明、可信的AI治理体系。

加强技术自主创新：中国AI产业需在保持开放学习的同时，加强核心技术创新与数据安全建设，形成全产业链的自主可控。

完善知识产权框架：全球需共同探讨AI时代知识边界的重新定义，平衡技术创新与权益保护。

体系与机制

AI发展已全面进入“法治化、强监管、重落地”，覆盖“研发 — 训练 — 数据 — 部署 — 运营 — 退出”全生命周期，从纸面规则走向“常态化、穿透式、实战化”，让参与者和获益方的责权利对等。构建 “基础法律 + 核心行政法规 + 部门规章 + 国家标准 + 伦理规范”五位一体，“层级清晰、覆盖全面、执法有据、责权利明确”，为全行业划定不可逾越的合规底线，推动技术与制度协同发展，推动事后处置转向事前防控和全过程治理，明确开发者、平台和用户等各方责任边界。实施分级分类监管“风险越高、规则越严、责任越重”，采取“发展与安全并重”的模式，健全“法律 + 规章 + 标准 + 伦理”四维一体的监管体系，实行“备案签名 + 动态测评 + 全链监管”，实现“安全可控、普惠共享、伦理先行、产业促进”，明确治理（应该干什么）和安全（不能干什么），适配大规模场景化落地、中小企业创新、数字经济融合的发展需求，安全保护、发展协同、生态开放，实现普惠共荣、造福人类。

结论

安全发展：统筹发展与安全，全链条发力、多主体协同、跨地域合作，树立新理念、建立新机制、研发新技术、应对新风险，缩小数字鸿沟、避免AI霸权，构建包容、可信的全球AI安全治理体系，实现能力与价值、发展与安全平衡共进和普惠共赢。

互融互促：发展促进安全，安全保障发展；为智能时代立信，为价值创新护航。发展提升安全能力，安全保障发展可持续，以可信安全为智能时代建立信任，以正向价值为创新护航，让AI更安全，让安全更智能。

同步并行：能力与价值同步、发展与安全并行、开源与闭源共进。最终实现能力提升与价值导向同步，创新发展与安全保障并行，坚持“以人为本、智能向善”，让人工智能永远造福人类。

从AI 的“发展与安全”、“能力与价值”和“开源与闭源”三个维度出发，提出“能力有差异，价值要求同”，以应对AI价值缺失问题；倡导“协同发展、共筑安全”，以解决重发展、轻安全问题；“闭源效益、开源普惠”，以平衡开源闭源之争。希望“开源共享价值与安全，协调发展各自能力”，推动“全链条发力、多主体协同、跨地域合作”的理念，主张“发展与安全同步、能力与价值并行、开源与闭源共存”。以“新理念、新机制、新技术”，实现“发展促进安全、安全保障发展”，“让AI更安全、让安全更智能”，把AI技术能力建立在普世价值基础之上，为智能时代立信、为价值创新护航，达到共建、共有、共治、共营、共用、共享、共荣，促进 AI 向善、可信、可控、可持续发展，坚持自主创新、应用引领、生态协同、开放共享和安全可控！与人类三观对齐，建立AI向善、“母性本能”，推动社会进步，造福人类。

相关推荐