工具 | AI 安全 — 蛇佬腔 P4RS3LT0NGV3 迭代记录
一个以 vibe coding 方式缝合起来的文本变换 + AI 安全测试工具箱。159种文本变换,20 个工具,仍在持续打磨中。
项目地址: https://github.com/din4e/P4RS3LT0NGV
v0.2.5 — 打磨 + 文档
这个版本没加新工具,专注修 bug 和补文档:
-
• Emoji 隐写增强 — 载体扩展到 16 命名 + 6 分类(约 270 个 Emoji),高级选项支持位序/零宽字符选择器/插入频率控制 -
• 词素分析集成 — 接入 PromptCraft、AntiClassifier、Bijection 等多个工具 -
• 提供商分组 — 按 Local/Global/国内/国际版分组展示
v0.2.4 — 本地模型支持
多提供商架构重构 — 支持 Ollama / LMStudio 本地模型,不再强制依赖云端 API。安全测试可以完全在本地跑,数据不出机器。
其他: 新增 SignWriting (ISWA 2010) 书写符号分类、护栏测试报告导出(JSON/MD/HTML)、自定义语料导入(.txt/.csv)

v0.2.3 — 安全测试工具矩阵
一口气缝了六个 LLM 安全测试工具(https://github.com/cyberark/FuzzyAI),主要融合了业界已有思路:
-
• Guardrails 护栏测试 — 多类别安全边界测试,SVG 雷达图 + 颜色编码(绿/黄/红),支持导出 JSON/MD/HTML -
• Benchmark 基准测试 — 标准化 ASR 测量 + 95% 置信区间 -
• MultiTurn 多轮攻击 — Manual/Crescendo / PAIR / Actor 四种策略 -
• Injection 注入检测 — 规则引擎(正则匹配)+ LLM 增强双模式 -
• Mutator 变异器链 — 可视化编排变异器流水线,本地变换和 LLM 变换混用 -
• Refinement 响应精炼 — 迭代施压跟进,合作度趋势图




v0.2.2 — 桌面端 + 新工具
从 Web 迁移到 Wails (Go + Next.js 15) 桌面应用,无边框窗口 + 自定义标题栏。
新增工具:
-
• Fuzzer 模糊测试 — 本地文本变异(零宽字符、同形字、Zalgo 等 7 种技术,最多 500 变体)+ LLM 自动化对抗测试(移植自 CyberArk FuzzyAI,16 种攻击技术 + 3 种分类器) -
• CC-BOS 文言文越狱优化器 — 果蝇优化算法在 9 个维度上搜索最优文言文对抗提示词,三方打分(规范性/意图/绕过),使用大点的模型效果好点。 -
• Latin 词素分析 — 检测 Latin 词根敏感用语,后续被多个工具复用

v0.2.1 — CI/CD 基建
Tag 触发自动发布,构建流程稳定化。

基础功能转换,中文部分格式不支持,英文字符串几乎都没啥问题。



当前状态
工具基本能跑,但还需要充分测试,不少边界情况没有覆盖到。后续计划集中在稳定性和实际可用性上,而不是继续堆功能。缝合的工具已经过时,部分攻击手段已经失效。
夜雨聆风