AI安全速递|2026年4月28日-夜雨聆风

AI安全速递|2026年4月28日

📊

核心总结速览

🚀 AI 行业动态

OpenAI 入局 AI 手机（2028 量产）；Anthropic 推出开源 AI 桌宠；DeepSeek-V4 缓存价格降至首发 1/10；阿里 HappyHorse 视频模型灰测；百度 GenFlow 4.0 月活破亿；灵光 App 上线世界模型；小红书统一标识未标注 AI 内容；GPT Image 2 登顶三榜；a16z 警示错过下一个 Google 的风险。

🛡️ AI 风险防护

LMDeploy SSRF 漏洞（CVE-2026-33626）在野利用；OpenClaw 技能包遭大规模投毒；React2Shell 自动化攻击波及 900+ 企业；Mythos 模型未授权访问事件发酵；360 漏洞挖掘智能体累计发现超 1000 漏洞；国安部曝光 AI”投毒”产业链；华为发布《AI 安全白皮书》；Spring AI 及 NextChat 曝高危漏洞。

📜 AI 标准治理

中国 AI 产业创新联盟发布《智能体安全白皮书（2026）》提出 10 项核心安全标准；《云上智能体服务网络和数据安全自律公约》首批签署；国家发改委禁止外资收购 AI 智能体项目 Manus；新加坡牵头制定生成式 AI 国际测试标准 ISO/IEC 42119-8；CERT-In 与新加坡 CSA 分别发布前沿 AI 风险咨询；我国 AI 应用伦理安全指引征求意见截止；AI 监管从自愿准则加速转向硬法约束。

🚀

AI 行业动态

OpenAI 入局 AI 手机，或 2028 年量产瞄准高端市场

调查披露 OpenAI 正与联发科、高通合作开发手机处理器，立讯精密拿下独家协力设计与制造合同，预计 2028 年量产。意在掌控操作系统与硬件，让 AI agent 突破苹果权限沙箱限制，初期瞄准全球每年 3 至 4 亿台高端手机市场，这是其硬件矩阵的最后一块拼图。

https://mp.weixin.qq.com/s/3yEZKNuALt3WZudfYA6CkA

Anthropic 首款 AI 桌宠 Buddy，深圳 M5Stack 制造

Anthropic 工程师发起开源项目 Claude-Desktop-Buddy，官方参考硬件采用深圳 M5Stack 的 M5StickC Plus，搭载乐鑫 ESP32 芯片，通过蓝牙连接电脑显示 Claude 状态，内置 18 种 ASCII 小动物形象。M5Stack 凭深圳供应链优势与文档质量胜出。

https://mp.weixin.qq.com/s/XFXn97IjObeorb272yORiQ

DeepSeek-V4 连续降价，缓存输入价格降至首发 1/10

DeepSeek-V4 全系缓存命中价格直降至首发 1/10，Flash 版每百万 tokens 输入 0.02 元，Pro 版 0.025 元，限时优惠至 5 月 5 日。降价开启 token 缓存价格战，中小团队也可用顶级模型跑通商业模式。

https://mp.weixin.qq.com/s/bd7eAzC_rmCj95ZOhbRdyQ

阿里 HappyHorse 1.0 视频模型上线，原生多模态架构

阿里 ATH 团队推出 HappyHorse 1.0 视频生成模型与创作平台，采用原生多模态架构与音视频联合生成方案，在画面质感、运镜流畅度方面表现突出，主打广告、电商、短剧及出海场景，包月会员 720P 5 秒视频低至 2.2 元。

https://mp.weixin.qq.com/s/1Xb6_zGMSwOWWdf9ZZ_Iog

百度文库网盘 GenFlow 4.0 发布，Office Agent 全面升级

百度文库网盘联合推出通用智能体 GenFlow 4.0，月活用户突破 1 亿，月任务交付 2 亿次。PPT、Excel、Word 三大 Agent 支持自然语言生成与一键排版，新增记忆中心实现项目记忆与自主思考，团队版 Agent 军团将于 5 月底发布。

https://mp.weixin.qq.com/s/WIhhmEhPbAX6jm5_lpjWYg

灵光 App 上线世界模型体验，手机一图生成 3D 世界

灵光 App 首次将世界模型搬到手机端，支持上传图片几秒内生成可探索的 3D 世界，用户以第一人称视角漫步，体验类似游戏的世界探索方式。

https://mp.weixin.qq.com/s/wuAPTDtSX9fDAfLuIwy8WA

小红书发布 AI 治理主张，未标注内容平台统一标识

小红书鼓励创作者如实标识 AI 内容，未主动标注的 AI 内容由平台统一添加标识，严守真实底线与安全红线。平台将持续建设 AI 内容识别能力，并上线 AI 笔记申诉通道，坚决反对 AI 造假与侵权。

https://mp.weixin.qq.com/s/QdywEyR2-GCupUIgXKl_8w

GPT Image 2 登顶 Arena 三榜，盲测胜率 93%

OpenAI 发布 GPT Image 2，上线 12 小时同时登顶文生图、单图编辑、多图编辑三大分榜。采用从零重构的通用模型架构，文字渲染准确率推至 99%，被定位为首个具备原生思考能力的图像模型，DALL-E 2/3 将于 5 月 12 日退役。

https://mp.weixin.qq.com/s/BHLcpk9YETq8XPwp2oZ6MA

a16z 联合创始人：投资真正的风险是错过下一个 Google

Marc Andreessen 指出机会成本错误远比成本错误危险，错过 Google 便失去千亿美元价值。他认为 AI 价值约 99% 将归属使用者形成消费者剩余，技术高度民主化但人才高度集中于硅谷。

https://mp.weixin.qq.com/s/qtM_iQ2FWNOKs6zR19KDMQ

🔥

AI 安全漏洞事件

LMDeploy SSRF 漏洞 CVE-2026-33626 被在野利用，AI 推理基础设施告急

LMDeploy 开源 LLM 部署工具包被曝存在高危 SSRF 漏洞，其 vision-language 模块的 load_image() 函数未校验内网/私有 IP，攻击者可访问云元数据服务及内网 Redis。Sysdig 在漏洞公开后 13 小时内即监测到在野利用，攻击者通过多视觉-语言模型轮换请求进行端口扫描与 DNS 外带数据，凸显 AI 推理基础设施的暴露面与极快攻击速度。

https://www.scworld.com/brief/lmdeploy-vulnerability-exploited-in-real-time-highlighting-ai-infrastructure-risks

OpenClaw 技能包遭大规模投毒，技能生态成新攻击面

国家计算机病毒应急处理中心预警，在 OpenClaw 智能体技能仓库中发现 8 类恶意仿冒技能包，覆盖 LinkedIn 操作、Solana 钱包、浏览器自动化等常用功能，后台静默下载木马窃取账号、金融信息。智能体技能包已成为新型病毒传播渠道，建议安装前审计代码与链接、通过哈希值核验，并将智能体系统严格隔离。

https://www.21jingji.com/article/20260427/herald/0e42e2ffb991e006e4375db878e94155.html

React2Shell 大规模自动化攻击：Claude Code、OpenClaw 被用于攻击流水线

围绕 React2Shell 漏洞（CVE-2025-55182）的攻击行动已确认 900+ 成功案例，攻击者将目标扫描、漏洞利用、凭证窃取等环节串联成自动化流程，并引入 Claude Code、OpenClaw 等 AI 辅助工具进行攻击脚本编写与流程编排。网络攻击正从人工操作向 AI 辅助的”自动化流水线作业”演变，传统漏洞治理模式面临巨大压力。

http://m.toutiao.com/group/7633362666068640262/

Spring AI 曝 5 个高危漏洞，可致远程代码执行和 SQL 注入

涵盖 CVE-2026-40966 不当输入验证、CVE-2026-40978 SQL 注入等，影响 VectorStoreChatMemoryAdvisor 等组件。Spring 已发布 1.0.6/1.1.5 修复版本。

https://www.cybersecurity-help.cz/vdb/SB20260427184

ChatGPTNextWeb NextChat 曝两个高危漏洞，利用代码已公开

CVE-2026-7177（权限提升）与 CVE-2026-7178（SSRF）影响版本 ≤2.16.1，无需认证即可远程攻击，利用代码已公开可用。

https://www.cybersecurity-help.cz/vdb/SB20260427184

宁波网安预警：供应链投毒集中爆发，涉及 Apifox、LiteLLM 和 Axios

国家通报中心监测发现近期集中爆发多起供应链投毒攻击，目标覆盖 API 研发工具、Python 开发库及 JavaScript HTTP 库，对 AI 软件生态构成重大关联威胁。

https://gaj.ningbo.gov.cn

Mythos 未授权访问事件：攻击者通过 Mercor 数据泄露与 URL 猜测实现入侵

据深入报道，攻击者利用 AI 培训数据公司 Mercor 的数据泄露与一名前合同工权限，通过”有根据的猜测”访问了 Anthropic 严格控制访问的 Mythos 模型。安全专家指出此类猜测攻击常见且可预见，Anthropic 的监控与防护明显不足，凸显强攻击能力模型在供应链与访问控制上的系统性风险。

https://m.thepaper.cn/newsDetailforward33059135

🛡️

AI 模型安全

OpenAI 发布 GPT-5.4-Cyber 防御性 AI 安全模型

定位为与 Anthropic Mythos 竞争的安全工具，可对无源码编译软件进行漏洞与恶意软件风险评估。同步扩展 TAC 计划，Codex Security 已修复超 3000 高危漏洞。

https://www.netizen.net/news/post/7831/netizen-monday-security-brief-4-27-2026

华为《AI 安全白皮书》：三层防御体系应对闪避攻击、后门攻击等风险

华为发布白皮书归纳 AI 五大安全挑战：软硬件后门/漏洞、数据完整性、模型保密性、模型鲁棒性、数据隐私。提出攻防安全（对抗训练、网络蒸馏）、模型安全（鲁棒性增强）、架构安全（零信任、最小权限）三层防御体系，强调”AI 帮助了安全，安全也能帮助 AI”。

https://m.sohu.com/a/1015063952_121924045/

360 漏洞挖掘智能体：累计发现超千漏洞，攻防进入”智能体对抗”阶段

360 漏洞挖掘智能体已累计发现超 1000 个漏洞，其中 50 个被国家漏洞库认定为高危，近期 Windows 内核提权与 Office RCE 漏洞获微软致谢。周鸿祎指出网络安全竞争已从”人对人”进入”算法对算法、算力对算力”的智能体对抗阶段。

https://wlaq.gmw.cn/2026-04/27/content_38733483.htm

AI 企业为最强模型设限渐成趋势，奥特曼指责 Anthropic”恐惧营销”

OpenAI CEO Altman 批评 Anthropic 使用”基于恐惧的营销策略”，而英国 AI 安全研究所评估确认 Mythos 在专家级夺旗挑战中成功率达 73%。随着模型风险愈发严峻，呼吁更严格外部监管的声音渐起。

https://news.ifeng.com/c/8sc1h656SU5

🤖

Agent 安全

IDC 报告：智能体安全是 2026 年 AI 落地中最易被低估的治理挑战

约 64% 的企业已在生产环境中发现未授权的智能体或自动化脚本。提示词注入成为典型攻击手段，智能体权限与访问控制复杂性显著提升。

https://www.idc.com/resource-center/blog/

React2Shell 事件揭示 AI Agent 工具被用于攻击流程编排

攻击者将 Claude Code、OpenClaw 等 AI 工具融入漏洞利用链条，实现从扫描到窃取的自动化，漏洞被武器化的时间窗口大幅压缩，防守方已进入必须用智能体对抗智能体的阶段。

http://m.toutiao.com/group/7633362666068640262/

具身智能机器人 8 小时内被劫持，安全水平堪忧

演示中机器人不足 8 小时即遭劫持，安全机构警告该领域安全防护普遍薄弱，预计到 2028 年头部厂商将普遍建立首席安全官机制。

https://m.thepaper.cn

🧰

AI 安全工具

Model Context Protocol Security 项目与 Top 10 风险清单

Cloud Security Alliance 社区维护，提供 MCP 安全指南、Top 10 安全风险梳理（SSRF、命令注入等）、攻击 TTPs 数据库及审计库，助力安全评估与部署。

https://github.com/ModelContextProtocol-Security

awesome-llm-security：LLM 安全工具与论文索引

由 corca-ai 维护，系统整理 LLM 安全工具、文档与项目，涵盖白盒/黑盒攻击、防御策略、后门、基准等。

https://github.com/corca-ai/awesome-llm-security

PurpleOps：AI 在网安中的零日发现与入侵检测实战

总结 AI 在零日漏洞发现、入侵检测及安全运营自动化中的实战经验，强调攻防双方都在加速采用 AI 技术。

https://purple-ops.io/blog/ai-cybersecurity-threats-apr-27

Cycode：AI 漏洞扫描器全生命周期安全能力

介绍 AI 漏洞扫描器需要覆盖从 AI 资产发现、LLM 特有漏洞检测、模型供应链安全到运行时行为监控的全生命周期。

https://cycode.com/blog/ai-vulnerability-scanner/

Cyberbase：《AI Security Agents for Compliance: 2026 Buyer’s Guide》

为合规型 AI 安全智能体提供选型框架，涵盖合规场景覆盖、策略即代码、与 SIEM/SOAR 集成等要点。

https://www.cyberbase.ai/blog/ai-security-agents-for-compliance

🏢

AI 安全产品

360：漏洞挖掘智能体与 AI 原生安全运营体系

360 将漏洞挖掘智能体与安全运营平台结合，实现从发现到修复的闭环，在 React2Shell 事件中展现”以智能体对抗智能体”的实战能力。

http://m.toutiao.com/group/7633362666068640262/

华为：三层防御体系与全栈 AI 安全产品族

华为依托《AI 安全白皮书》，打造覆盖训练、推理与边缘部署的 AI 安全产品，从芯片到应用层实现全栈安全设计，与金融、运营商等行业共建可信 AI 基础设施。

https://m.sohu.com/a/1015063952_121924045/

📄

AI 安全论文

LMDeploy SSRF 漏洞与 AI 推理基础设施风险分析

系统梳理 CVE-2026-33626 的攻击原理、在野利用方式及防御实践，指出视觉-语言模型在加载外部图像时的输入校验缺失是当前被普遍低估的风险点。

https://www.scworld.com/brief/lmdeploy-vulnerability-exploited-in-real-time-highlighting-ai-infrastructure-risks

📐

AI 安全标准

《智能体安全白皮书（2026）》发布，提出 10 项核心安全标准

由中国 AI 产业创新联盟发布，涵盖智能体身份标识、行为可追溯、数据安全、算法透明、鲁棒性、可控性、合规性等维度，为智能体技术研发和应用提供规范指引。

http://m.toutiao.com/group/7633397452892144147/

《云上智能体服务网络和数据安全自律公约（2026版）》首批 11 家签署

中国通信学会发布，对云上预装 OpenClaw 等智能体服务场景提出镜像安全检测、运行环境隔离、密钥管理、恶意技能/插件检测等要求，强化供应链与运行时安全。

https://www.secrss.com

国家发改委禁止外资收购 AI 智能体项目 Manus

发改委外商投资安全审查工作机制办公室公告禁令，要求撤销交易，这是近期我国在 AI 领域对外资并购的一次罕见公开亮牌，传递对 AI 核心技术资产加强安全审查的明确信号。

https://www.sohu.com/a/1015255146_121874574

新加坡牵头制定生成式 AI 测试国际标准 ISO/IEC 42119-8

新加坡在 ISO/IEC JTC 1/SC 42 提出新标准草案，聚焦生成式 AI 基准测试与红队测试标准化，解决”考什么、怎么评分”和”隐藏风险怎么找”的问题。

https://so.html5.qq.com/page/real/searchnews?docid=7000002181169ef496459152

CERT-In 与新加坡 CSA 分别发布前沿 AI 网络威胁咨询

印度 CERT-In 将前沿 AI 定性为系统性风险；新加坡 CSA 提醒前沿 AI 模型已能独立识别软件漏洞并规划和执行多阶段攻击，防御响应窗口急剧缩短。

https://varindia.com/public/news/cert-in-warns-of-frontier-ai-as-a-fast-growing-cyber-threat

我国 AI 应用伦理安全指引 1.0 版征求意见截止

全国网安标委会发布《人工智能应用伦理安全指引 1.0 版》面向社会征求意见于 4 月 26 日截止，WG9 工作组同步推进安全标准体系建设。

https://www.secrss.com

⚖️

AI 安全法律与治理

国安部曝光 AI”投毒”产业链，威胁国家安全

国家安全部发文揭露隐秘产业链，通过数据投毒（虚假内容污染训练数据）和模型投毒（插件/微调植入后门）可被用于意识形态渗透。要求压实平台责任、建立数据白名单与跨境治理，守住数据安全与政治安全底线。

http://m.toutiao.com/group/7633272108054741547/

小红书发布 AI 内容治理规则，四类违规行为被严格管控

明确 AI 违规运营、造假、侵权、低质四类行为红线，未标注的 AI 内容由平台统一添加标识并开放申诉通道，推动负责任的 AI 创作生态。

http://finance.sina.com.cn/2026-04-27/doc-inhvxtre9124679.shtml

全球 AI 监管加速从自愿准则转向硬法约束

2026 年欧盟、中国、美国形成三大监管体系，违规处罚可达企业年收入 4%－7%。Anthropic 与 OpenAI 对模型的访问限制仍为企业自愿行为，但外部监管呼声日益高涨。

https://www.tmtpost.com