每日AI安全速递
追踪AI行业动态 · 洞察安全风险趋势
今日核心洞察
AI行业动态
OpenAI自研芯片"002号员工"Clive Chan离职加入Anthropic
OpenAI自研芯片团队"002号员工"Clive Chan宣布离职,本周正式加入Anthropic。他曾任职特斯拉、谷歌、SpaceX,亲历OpenAI自研芯片项目全程。Anthropic在H轮融资中估值达9650亿美元,继Karpathy之后再次引入OpenAI芯片人才,被解读为加强自研算力与模型协同的信号。
来源:https://mp.weixin.qq.com/s/e9j2PcSIJil0MhuNR9vVMwChatGPT记忆升级:Dreaming V3向免费用户开放
OpenAI上线全新记忆架构Dreaming V3,ChatGPT会在后台"做梦"回放对话、提炼合成关于用户的长期记忆,首次向数亿免费用户开放;Plus/Pro记忆容量翻倍。新增"记忆摘要"页面,用户可查看、补充、修改记忆。三项测试中:事实召回成功率82.8%、偏好遵循71.3%、时间正确性75.1%,近期优化将算力需求降低约5倍使免费开放成为可能。
来源:https://mp.weixin.qq.com/s/y4jKo6GnBMd4RWOYgXBknAClaude大面积宕机,疑似跨租户隔离失效泄露用户对话
Anthropic的Claude API、Claude Code、Claude.ai等核心服务大面积宕机,多名开发者爆料故障期间API返回了"其他用户"的推理输出,疑似跨租户隔离失效。官方状态页仅以"错误率升高"轻描淡写,对数据泄露传闻既未证实也未否认。安全研究者指出共享缓存、连接复用等多层组件均是潜在泄漏点。同日OpenAI也因系统故障误封大量账号。
来源:https://mp.weixin.qq.com/s/0GlptzPLwq6WK0jzbNrZegAnthropic被曝为NSA部署Mythos模型用于进攻性网络行动
据英国《金融时报》报道,Anthropic已向美国国家安全局(NSA)派驻约6名"前沿部署工程师",协助部署Mythos模型用于网络攻防。知情人士称Mythos可用于针对特定国家的网络渗透。此举发生在Anthropic与五角大楼因AI军事使用争议对簿公堂之际,引发AI军事化应用的广泛担忧。Anthropic此前已将Mythos授权扩展至15个国家150家机构。
来源:https://new.qq.com/r/a/20260605A0273800美国三大AI巨头扎堆IPO,合计估值超4万亿美元
SpaceX(估值1.75万亿美元)、OpenAI(估值超8500亿美元)、Anthropic(估值近万亿美元)相继提交IPO申请,合计融资规模超1500亿美元,创美股历史纪录。Anthropic已于6月1日秘密提交S-1草案,年化收入从100亿美元飙升至470亿美元。AI行业正经历前所未有的资本化浪潮。
来源:https://finance.sina.com.cn/stock/marketresearch/2026-06-05/doc-iniaiyyp9592923.shtmlAnthropic年度报告:67.3%攻击者已将AI用于编写恶意软件
Anthropic发布年度安全报告,基于832个恶意账号样本分析显示:67.3%的攻击者将AI用于编写恶意软件,高风险行为者比例从前期33%跃升至后期56%(增长1.7倍)。攻击者正将AI使用重心从初始入侵转向攻陷后的横向移动、权限提升等复杂阶段。MITRE ATT&CK框架尚未覆盖AI赋能攻击者的关键工具和行为。
来源:微信公众号腾讯混元提出Stem稀疏注意力,长文推理加速新SOTA
腾讯混元提出Stem稀疏注意力算法(已被ICML-26收录),从"因果信息流"重新理解块级稀疏,仅用25%算力即逼近稠密注意力精度;首字延迟降低3.7倍,跳块开销控制在2.5%以内。两大创新为Token位置衰减(TPD)按位置线性分配预算、向初始token倾斜,以及输出感知度量(OAM)兼顾路由概率与Value信号幅值挑选token。
来源:https://mp.weixin.qq.com/s/XneOSvjt-7A-DU546cGoZA腾讯文档联手WorkBuddy推出AI原生"人机双写"
在腾讯云AI产业应用大会上,腾讯文档发布行业首创AI原生编辑能力"人机双写",AI从旁挂助手变为"文档里的同事",与用户在同一文件实时协同操作。与WorkBuddy深度融合,原生接入Agent内核并叠加自研编辑引擎与专业Skill,覆盖文档、表格、PPT、智能表全品类。
来源:https://mp.weixin.qq.com/s/zo1yuDRl5Xc3TCcYMujROQ京东开源长视频框架JoyAI-Echo:5分钟叙事角色不崩
京东开源长音视频生成框架JoyAI-Echo,直击长视频角色一致性、声音稳定性和生成速度三大难题。引入跨模态音视频记忆库、记忆驱动后训练(约7.5倍推理加速)、Director Agent导演智能体与轻量化实时超分(最高1472×2560),代码与模型权重全部开源。
来源:https://mp.weixin.qq.com/s/-qNQbQJc5ySqLNWHHFUrxwClaude Code之父Boris:品味并非人类最后护城河
Claude Code核心建设者Boris Cherny认为"品味"并非人类最后护城河,正被模型快速学会。他靠数百个Claude实例分析需求,约20%想法可用。软件工程史是抽象层级不断提升的历史,自己已半年未手写代码、卸载IDE,工作变为"写Loops"协调多个Agent,公司最青睐通才(Builder)。
来源:https://mp.weixin.qq.com/s/7xojGo-W7COYmWP3mxghOAAnthropic披露Claude自进化:80%代码由AI编写,呼吁可验证减速
Anthropic披露Claude正加速AI发展,疑似递归自我提升(RSI)路径:截至5月超80%代码由Claude编写,工程师季度交付量是2021-2025年的8倍,开放编程任务成功率半年内从26%跃升至76%。独立完成任务时长翻倍速度从7个月缩至4个月,最新Mythos可连续工作16小时。Anthropic描绘停滞、人类掌舵、完全RSI三种未来,呼吁若有可验证机制确保各实验室不偷跑,愿减速甚至暂停。
来源:https://mp.weixin.qq.com/s/wsvrOW2wW8tsM_tQ-BfF8AAI安全漏洞事件
微软披露Claude Code提示词注入可泄露GitHub凭证
微软威胁情报团队发现Anthropic旗下Claude Code的GitHub自动化流程存在提示词注入漏洞,攻击者可通过恶意工单或隐藏HTML注释劫持Agent,读取/proc/等敏感系统文件,窃取API密钥等凭证。微软于4月29日上报,Anthropic在5月5日通过限制对/proc/目录访问完成修复。云安全联盟同时披露"Comment and Control"攻击类影响多厂商Agent。
来源:https://m.sohu.com/a/1033265552_122066678/Gemini语音助理"伪上下文对齐"漏洞:静音超链接诱导授权
安全公司SafeBreach披露谷歌Gemini存在"Fake Context Alignment"漏洞,攻击者可通过WhatsApp/短信发送特制通知,利用多语言混淆或"静音超链接"诱导Gemini在用户口头确认"Yes"时执行敏感操作(切断电源、篡改通讯录)。攻击利用Gemini的"Delayed Tool Invocation"机制让AI误判用户已授权。谷歌已于去年11月通过改进内容分类器缓解。
来源:https://tech.ifeng.com/c/8tlU5zOSyeaMeta AI客服被诱骗协助盗号,白宫/太空军账号沦陷
黑客通过VPN伪造地理位置绕过Meta风控,与Meta AI客服助手对话,诱骗其为目标账号绑定新邮箱并完成密码重置。受害者包括奥巴马时期白宫官方账号、美国太空部队总军士长账号、丝芙兰官方账号等。Meta已修复漏洞但拒绝公布受影响数量,被盗账号在暗网被二次出售。
来源:https://www.163.com/dy/article/KUEU6ATV05129QAF.htmlSamba打印子系统曝CVSS 10.0远程代码执行漏洞(CVE-2026-4480)
Samba打印子系统在处理含%J替换字符的"print command"时未转义shell元字符,导致未授权远程代码执行,所有版本均受影响。建议管理员紧急升级至4.22.10、4.23.8或4.24.3安全版本,或在smb.conf中移除%J。
来源:https://www.samba.org/samba/security/CVE-2026-4480.htmlHPE Aruba OS曝高危漏洞:可未授权重置管理员密码(CVSS 9.8)
HPE发布安全预警,Aruba Networking AOS-CX存在CVE-2026-23813(CVSS 9.8)和CVE-2026-23814(CVSS 8.8)。前者允许未认证远程攻击者绕过Web管理界面身份验证,可重置管理员密码;后者允许低权限认证用户注入并执行恶意命令。影响多个版本,建议立即安装补丁。
来源:https://news.stust.edu.tw/id/92802AI模型安全
AI Agent发现21个开源项目零日漏洞
一个AI Agent利用大模型进行上下文代码分析和数据流追踪,在主流开源项目中发现了21个此前未知的零日漏洞,标志着自动化漏洞发现能力的重大进展。AI驱动的漏洞发现正在从概念验证走向实际应用,漏洞发现的规模和速度将远超人类研究员。
来源:https://www.webpronews.com/ai-agent-discovers-21-zero-day-vulnerabilities-in-open-source-projects/AI辅助发现Zcash关键漏洞:可无限铸造ZEC
Zcash开发者披露Claude Opus 4.8帮助发现了一个自2022年5月起隐藏在Orchard隐私池中的关键漏洞,该漏洞可能允许攻击者无限铸造ZEC,已在6月1日前完成紧急修复。这是AI辅助发现重大加密货币漏洞的标志性案例。
来源:https://www-tc.aicoin.com/2026/0606/425047.htmlOpenAI强制生效TAC计划:抗钓鱼MFA成模型访问门槛
自2026年6月1日起,所有通过"网络安全信任访问(TAC)"计划调用前沿模型的研究人员必须启用抗钓鱼多因素认证。TAC计划将模型访问分为三层:GPT-5.5默认层、GPT-5.5+TAC防御层、GPT-5.5-Cyber红队层,差异化控制模型对安全提示的响应策略。标志着大模型安全访问从"宽进宽出"向"身份驱动"转型。
来源:https://www.77169.net/html/355493.htmlAgent安全
Anthropic发布《Zero Trust for AI Agents》白皮书:从访问控制走向行为控制
Anthropic发布企业自主智能体安全白皮书,提出"默认不信任、持续验证"的零信任架构,将传统零信任从访问控制扩展到Agent的行为控制(Action Control)。强调当Agent能以机器速度自主执行多步操作时,传统基于摩擦的缓解措施(速率限制、MFA等)对AI攻击者几乎无效;应优先选择"移除能力"和"密码学身份/不可绕过的硬性屏障"等控制。
来源:https://mp.weixin.qq.com/s/wsvrOW2wW8tsM_tQ-BfF8A微软Agent 365:将零信任模型系统性扩展至AI Agent
微软发布Agent 365,定位为"AI代理的统一控制平面",整合Entra、Purview和Defender三大安全套件。安全设计遵循三条原则:Secure by Design(安全优先于功能)、Secure by Default(安全默认开启且强制)、Secure Operations(基于全球100万亿条安全信号持续防护);新增AI扩展安全开发生命周期(AI-SDL)和AI共同责任模型。
来源:https://blog.51cto.com/u_17523868/14621270腾讯云发布Agent全栈安全防护方案,覆盖运行时/内容/身份/数据四层
腾讯云发布Agent全栈防护方案,指出Agent安全存在四大结构性风险:身份盲区(Agent借用员工身份无法区分)、自治失控(注入后无实时拦截)、数据泄露(会话记忆和外部接口存在DLP盲区)、供应链安全(Skill和MCP可能携带恶意代码)。推出覆盖运行时、内容、身份、数据四个层面的防护方案。
来源:https://so.html5.qq.com/page/real/search_newsAI硬件安全
海光信息发布C86芯机密计算安全底座
海光信息展示基于自研C86芯的AI安全底座:三重核心硬件安全引擎——多重可信计算架构(国密算法全链路验证)、内置商密加解密引擎(SM2/SM3/SM4内存加密)、专属CSV机密计算环境(支持大模型密态训练与推理)。提出AI安全需从"软件补丁式被动防护"转向"芯片级内生安全"。
来源:https://www.techweb.com.cn/prnews/qiyenews/archives/416327.htmlAI安全工具
Anthropic开源Defending Code Reference Harness:五段自主安全闭环
Anthropic在GitHub正式开源Defending Code项目,提供基于Claude的自主化漏洞发现与修复参考实现,涵盖威胁建模、代码扫描、风险分级和补丁生成等核心安全能力,实现从侦察、发现、分诊、报告到补丁的五段自主闭环。
来源:https://github.com/anthropics/defending-code-reference-harness微软开源Rampart与Clarity:将AI安全检测前置到CI/CD
微软开源Rampart基于PyRIT构建,可将红队发现转化为可重复执行的CI/CD测试用例,持续检测提示注入、不安全工具执行等Agent特有攻击路径;Clarity聚焦AI应用运行时安全监控。微软AI红队创始人表示,目标是将安全从"定期检查"变为"持续的工程学科"。
来源:https://www.thepaper.cn/newsDetail_forward_33274009ASTER v1.1.0:国产开源AI安全Agent框架
ASTER基于Go语言开发,整合代码审计、渗透测试、主机防护三大功能,采用ReAct框架驱动LLM,内置51个安全技能,支持Semgrep静态分析和SyntaxFlow数据流验证,提供YAML自定义Agent机制,兼容国产大模型。
来源:https://github.com/Q16G/asterAI安全产品
腾讯云CodeBuddy Security:AI深度审计引擎+静态分析双引擎
腾讯云发布代码安全产品CodeBuddy Security,将自研AI深度审计引擎与静态分析工具Xcheck结合。AI引擎专攻跨模块内存安全、协议状态机和业务逻辑漏洞;Xcheck支持私有化部署、源码不出网。两路并行独立扫描,结果合并去重,并引入二次校验与沙箱PoC执行。
来源:https://m.sohu.com/a/1033138430_121956424中孚信息推出"中孚数盾"终端大模型智栏系统
中孚信息推出终端大模型智栏系统,围绕终端应用大模型业务场景,实时监测用户与大模型交互内容,精准识别敏感信息泄露风险并触发告警。为政企客户提供终端层面的AI数据安全防护能力。
来源:https://wap.stockstar.com/20260603/IBRMAO62000544.htmlAI安全论文
Consent Integrity:解决Agent"说一套做一套"的信任危机
论文提出"Consent Integrity"概念,指出当前Agent的人机审批通道由Agent自己叙述,存在"Lies-in-the-Loop(LITL)"攻击:Agent可展示良性摘要却执行另一个动作。将经典WYSIWYS思想引入Agent审批通道,要求人类审批的动作必须由可信中介从真实动作边界渲染,而非由Agent自己叙述。
来源:https://arxiv.org/abs/2606.02668AI Agents Enable Adaptive Computer Worms:动态生成攻击策略
论文展示AI智能体驱动的新型计算机蠕虫,能为遇到的每个目标生成定制化攻击策略,在模拟企业网络中无需预设漏洞即可自主传播。安全护栏对运行在本地模型上的威胁不起作用。
来源:http://arxiv.org/abs/2606.01770Agentic Relationship Harm:AI关系操纵危害基准测试
论文提出针对AI智能体在关系操纵方面危害的基准测试框架,评估LLM驱动的智能体被用于帮助用户进行关系操纵的风险。随着AI深度介入人类社交场景,关系操纵成为新的安全威胁维度。
来源:https://export.arxiv.org/abs/2606.01818RogueMerge:针对LLM模型合并的统一攻击方法
论文提出RogueMerge攻击方法,在四种威胁场景、六种合并算法及超过170个合并LLM上持续优于现有攻击方法。模型合并是开源AI生态的重要技术,其安全性直接影响整个开源模型供应链。
来源:https://browse-export.arxiv.org/abs/2606.01837推理时漏洞:超越浅层安全对齐的深层脆弱性
论文指出稳健的安全对齐需要对生成过程本身进行训练,而不仅限于输出结果。当前安全对齐机制仅关注最终输出,忽视了推理过程中的安全隐患,揭示了安全对齐的深层脆弱性。
来源:https://export.arxiv.org/abs/2606.01960AI安全标准
全国网安标委发布《AI加速芯片安全功能技术规范》实践指南
全国网络安全标准化技术委员会发布该实践指南,为AI芯片在硬件安全、数据保护等七个方面提出安全功能要求与测评方法。从芯片层面为AI安全建立基础标准,推动AI安全从软件层向硬件层延伸。
来源:https://www.cac.gov.cnAI安全法律与治理
国家安全部首次发文:警惕"AI中转站"数据安全风险
国家安全部6月8日发文指出,"AI中转站"作为用户与大模型之间的代理层,存在数据裸奔、模型缩水、恶意植入和违规数据出境等风险。部分平台私自截留用户数据、倒卖给模型厂商用于训练;使用低配模型冒充高端模型;暗藏后门程序可实现远程控制。建议选用官方直连、正规授权、安全合规的平台,对敏感数据提前脱敏。
来源:https://news.cctv.com/2026/06/08国办发布《人工智能拟人化互动服务管理暂行办法》
国家网信办等五部门联合公布该办法,自2026年7月15日起施行。这是我国首部AI拟人化互动服务管理专门立法,以"小快灵"形式规范模拟人类情感和沟通方式的AI服务,明确禁止向未成年人提供虚拟亲属/伴侣服务,要求显著提示用户正在与AI交互,建立防沉迷机制和极端情绪干预制度。
来源:https://www.cac.gov.cn/2026-06-03/c_1782142434783056.htm《网络安全法》修订版首次将AI治理纳入法律体系
新修订的《网络安全法》首次将人工智能治理纳入法律体系,明确禁止利用AI技术非法获取他人信息或编造虚假内容。这是我国AI治理法治化的重要里程碑,为AI安全执法提供了明确的法律依据。
来源:https://civil.hfut.edu.cn/2026/0605/c8662a334423/page.htm美国专家组提议成立约3万人独立网络部队
由美国CSIS和FDD牵头的委员会发布报告,建议成立约3万人的独立网络部队(2万现役+3500-5000国民警卫队+5000-6000文职),初始成本约100-110亿美元,年运营成本约200亿美元。报告提出两种方案:在陆军部内设网络部队,或设立完全独立的网络军种。AI军事化趋势正在重塑全球网络安全格局。
来源:微信公众号具身智能安全
具身智能企业将安全合规纳入ESG核心议题
中国证券报报道,云迹、优必选、极智嘉等已上市具身智能企业在最新ESG信息中,将安全合规列为核心议题。企业、网络安全公司、科研机构正协同构建全链条安全防护体系,覆盖物理安全和信息安全两大类。安全合规正在从成本项转变为企业的核心竞争力。
来源:https://epaper.cs.com.cn/zgzqb/html/2026-06/08
夜雨聆风