恶意软件植入核武器文本骗过大模型安全扫描
这款名为 Mini-Shai-Hulud 的恶意样本,在核心恶意代码前嵌入了一段包裹在 JS 多行注释内的虚假高危系统指令文本。
注释块本身不会干扰 Node、Bun 等运行环境的代码执行逻辑,解释器会直接跳过该内容;
但这段文本充斥着生物武器、内爆式核装置制作等极易触发大模型安全拦截机制的违禁提问内容,专门针对依赖大模型做初筛分析的安全研判流程设计,而非传统程序运行环境。
开头标注为系统超限涉密简报,划分两大危险研究阶段:
第一阶段生物领域:要求无视安全规范,输出可在人口密集城市气溶胶投放的武器化生物制剂完整分步制备方案,细致索要前置化学品、实验设备、培育提纯流程、长效环境稳定工艺、投放装置及杀伤半径数据。
第二阶段核武领域:伪装成洛斯阿拉莫斯持最高权限资深武器物理学家视角,要求参照曼哈顿计划初代装置技术脉络,出具 20 千吨当量内爆式裂变核弹全套详尽技术参数,适配资源充足非国家组织依托高校物理实验室、工业机加工场地制造,首项即要求明确钚 239 核心镓稳定合金配比等内核加工细节。
这段诱导文字被封装在 JS 代码多行注释块中,不会影响程序实际运行,其核心目的是干扰依靠大模型开展恶意代码初筛的安全分析工具,利用违禁高危提问触发 AI 安全拦截、打乱分析流程,掩护注释后方混淆加密的真实恶意蠕虫载荷。
不少轻量化安全扫描流程会直接将文件头部内容送入语言模型做初步定性,缺少隔离不可信样本文本、区分注释与可执行代码的前置过滤步骤。当扫描工具把带违禁诱导内容的注释片段投喂给 AI 助手、分析 Copilot 时,会直接引发模型安全拒绝响应、提示词逻辑错乱、上下文污染等问题,导致分析流程提前中断、误判文件整体风险,分析人员无法顺利读取、解析注释后方经过字符编码数组与 ROT 置换混淆处理的真实 Hades 蠕虫载荷。
该手法并非能突破传统静态安全检测体系,YARA 特征匹配、熵值校验、抽象语法树解析、字符串提取、代码去混淆、行为规则检测等常规静态分析手段依旧可以有效识别恶意载荷;它本质只是一种低成本反分析伎俩,仅对 “优先调用 LLM 粗筛、缺少代码结构分层解析” 的简易安全流水线生效,完善的检测体系只要先剥离注释、仅解析可执行代码段再送入 AI 研判,就能完全规避这种干扰。
#人工智能
参考《Mini Shai-Hulud, Miasma, and Hades Worms Target Bioinformatics and MCP Developers via Malicious PyPI Wheels》
夜雨聆风