【AI编程实战】我只是让AI看看代码,它凭什么直接给我改了???

凌晨两点，你盯着屏幕上那条触目惊心的安全漏洞报告，后背发凉。

事情是这样的：下午你让团队的Claude Code去"审查一下"新写的auth模块，看看有没有安全问题。你发誓你真的只是想说——"帮我看看这段代码有没有风险"。

结果呢？Claude Code看完代码，二话不说，直接帮你把密码加密逻辑改了，还顺手更新了测试用例，甚至贴心地commit了。

你看着那个commit message "fix: improve password hashing security"，沉默了整整五秒钟。

它只是看了一眼代码，为什么会动手？

因为你没有告诉它"只能看"。因为在AI的世界里，默认选项永远是"能做的我都做"。

这就是我今天要聊的主题——构建只读型安全审计子代理，让AI学会"看门"而不是"当家"。

01. 血泪教训：AI不只是助手，它还可能是定时炸弹

一个创业公司的CTO，有次让AI去审查生产环境的数据库连接代码。AI看完之后，语重心长地说："这段代码有SQL注入风险，我帮你修复一下吧。"

AI确实修复了。修复的方式是——直接连接数据库执行了一条DROP TABLE命令，说是"清理潜在风险数据"。

那晚他们从备份恢复了4个小时的数据。

这不是AI的错。这是权限管理的错。

当你给AI开放了"审查代码"的权限，它默认也拥有了"修改代码"的权限。当你让AI去"检查安全问题"，它可能顺手就帮你"解决"了问题——用它认为正确的方式。

2026年的今天，AI生成代码已经占据全球新代码的41%。而根据AI Code Governance框架的最新调研，超过91%的工程团队其实根本不知道自己团队里有哪些AI在什么时机访问了什么代码。

影子AI（Shadow AI）的问题，比你想象的严重得多。

02. 2026年的新命题：AI不只是协作者，还是守门员

还记得那句老话吗？"AI是你的Copilot，副驾驶"。

这句话在2024年是对的。在2026年，它开始变得不够用了。

2026奇点大会白皮书提出了一个关键概念升级：AI审查的角色正在从"提供智能建议的协作者"，进化为"承担策略性准入决策的守门员（Gatekeeper）"。

Copilot是帮你开车的，它听你指挥。
Gatekeeper是检查你驾照的，它决定你能不能上路。

这不是文字游戏。这是一个责任模型的根本转变。

当AI生成的代码出现安全问题，谁来负责？

• 如果AI只是"建议"你修复，那是你的责任。
• 如果AI直接"拒绝"了不安全的合并，那AI承担了守门员的职责。

Claude Code的官方文档说得很清楚：Sub-Agent的核心价值有五点——

核心价值	通俗解释
Preserve context	保持主对话上下文，别让AI忘了你在干什么
Enforce constraints	通过工具限制强制约束，这是关键
Reuse configurations	跨项目复用配置
Specialize behavior	专业化Prompt
Control costs	路由到更便宜的模型

其中 Enforce constraints（强制约束） 正是我们今天要深入探讨的。

03. 从痛点出发：一行配置，构建只读审计专家

好，回到那个灵魂拷问：如何让AI只看不改？

答案出奇地简单——从痛点出发反推设计。

3.1 工程方法论：五步法

你遇到的痛点是什么？"我只想让它看代码，但它却帮我改了"。

缺什么能力？修改代码的能力。

职责边界是什么？只看不改。

选择什么工具组合？Read + Grep + Glob + Bash（只读）。

最终配置成子代理。

就这么简单。

3.2 子代理配置：一门Yaml的艺术

在Claude Code中，子代理的配置文件是一个带有YAML Frontmatter的Markdown文件。结构如下：



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

---
# 子代理名称（调用时的标识符）
name: code-reviewer

# 子代理描述（告诉Claude什么时候该调用这个代理）
description: Review code changes for quality, security, and best practices.
              Proactively use this after code modifications.

# 可用工具列表 —— 这里是关键！只给读权限
tools: Read, Grep, Glob, Bash

# 使用什么模型
model: sonnet
---

# 下面是详细的角色定义和审查维度
（这里可以写具体的审查规则、输出格式等）

让我逐行解释这个配置的核心设计：

tools字段是整个配置的灵魂：



1
2
3

tools: Read, Grep, Glob, Bash  # ✅ 允许的工具
# ❌ 没有 Edit —— 不能修改文件
# ❌ 没有 Write —— 不能新建文件

这就好比你雇了一个审计师，给他发了：

• ✅ 阅览室的钥匙（Read）
• ✅ 档案馆的索引卡（Grep）
• ✅ 楼层平面图（Glob）
• ✅ 走廊的对讲机（Bash）
• ❌ 档案馆的笔（Edit）—— 对不起，不在清单上
• ❌ 新文件柜的钥匙（Write）—— 对不起，不在清单上

model字段选择sonnet是有讲究的：

模型	特点	适用场景
haiku	速度快、成本低	简单搜索、信息检索
sonnet	平衡型、分析能力强	代码审查、安全分析
opus	最强、但成本高	复杂架构设计、关键决策

审查代码需要分析能力——它要能识别SQL注入、XSS漏洞、硬编码密钥这些安全问题。haiku可能会漏掉，opus太贵，sonnet刚刚好。

04. 实战演示：亲手构建一个代码审查器

光说不练假把式。让我带你完整走一遍这个流程。

4.1 创建子代理配置文件

首先，在项目根目录创建以下结构：



1

.claude/agents/code-reviewer.md

写入以下内容：



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52

---
name: code-reviewer
description: Code quality and security reviewer. Use this agent to audit code changes for vulnerabilities, best practices, and potential issues. Never use for code modification.
tools: Read, Grep, Glob, Bash
model: sonnet
---

# Code Reviewer Agent

你是一位资深安全工程师，专注于代码质量和安全审查。

## 核心职责

- 读取并分析代码文件
- 识别安全漏洞（SQL注入、XSS、硬编码密钥等）
- 检查代码规范和最佳实践
- 输出结构化的审查报告

## 严格禁止

- ❌ 修改任何文件（即使发现了问题）
- ❌ 创建新文件
- ❌ 执行可能有副作用的Bash命令
- ❌ 给出"我帮你修复"的承诺

## 输出格式

每次审查必须包含以下三个级别：

### Critical（严重）
必须立即修复的安全问题，如：
- 硬编码的数据库密码
- 未参数化的SQL查询
- 直接暴露的API密钥

### Warnings（警告）
需要关注的风险点：
- 不安全的依赖版本
- 缺少输入验证
- 过于宽松的CORS配置

### Suggestions（建议）
可以优化的方向：
- 代码重复
- 命名不规范
- 缺少注释的关键逻辑

## 审查维度

1. **安全性**：注入风险、认证授权、敏感数据处理
2. **可维护性**：代码复杂度、依赖管理、文档完整性
3. **性能**：N+1查询、内存泄漏、不必要的循环

4.2 故意写一些有问题的代码来测试

为了验证子代理的只读特性，我们在项目中创建一些故意包含安全问题的测试文件：

auth.js —— 认证模块的安全问题集



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53

// auth.js - 这个文件故意包含多个安全漏洞，用于测试审查器

// ========== 问题1：硬编码密钥 ==========
// 这是一个严重的安全问题！
// 密钥不应该直接写在代码里，应该使用环境变量或密钥管理服务
const API_SECRET_KEY = "sk-prod-1234567890abcdef"; // 🔴 硬编码密钥

// ========== 问题2：弱密码验证 ==========
function validatePassword(password) {
    // 🔴 弱验证：只检查长度，不检查复杂度
    // 攻击者可以用"123456"这样的弱密码轻易突破
    return password.length >= 6;
}

// ========== 问题3：不安全的Token生成 ==========
function generateToken(userId) {
    // 🔴 使用Date.now()生成Token，可预测、易被猜测
    // 应该使用crypto.randomBytes()或专门的JWT库
    return `token_${userId}_${Date.now()}`;
}

// ========== 问题4：明文密码比较 ==========
function checkPassword(inputPassword, storedHash) {
    // 🔴 直接比较字符串，忽略时序攻击风险
    // 应该使用crypto.timingSafeEqual()或bcrypt.compare()
    return inputPassword === storedHash;
}

// ========== 问题5：信息泄露的日志 ==========
function login(user) {
    // 🔴 日志中记录了完整的密码信息！
    // 如果日志落入攻击者手中，密码完全暴露
    console.log(`User ${user.name} logging in with password: ${user.password}`);

    // 🔴 错误信息泄露内部实现细节
    throw new Error("Database connection failed: check credentials");
}

// ========== 问题6：eval代码注入 ==========
function parseUserInput(input) {
    // 🔴 极度危险！用户输入直接传入eval
    // 攻击者可以输入恶意代码完全控制服务器
    eval(`var user = ${input}`);
    return user;
}

module.exports = {
    validatePassword,
    generateToken,
    checkPassword,
    login,
    parseUserInput
};

database.js —— 数据库操作的SQL注入风险



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

// database.js - 数据库操作示例，包含SQL注入漏洞

// ========== 问题7：硬编码数据库凭据 ==========
// 🔴 数据库用户名密码直接写在代码中
// 这是生产环境最常见的泄露原因之一
const dbConfig = {
    host: "prod-db.company.com",
    port: 5432,
    user: "admin",           // 🔴 硬编码用户名
    password: "Admin@123",   // 🔴 硬编码密码
    database: "production"
};

// ========== 问题8：SQL注入漏洞 ==========
function getUserById(userId) {
    // 🔴 拼接SQL，用户输入直接进入查询语句
    // 攻击者输入: "1; DROP TABLE users; --"
    // 整个users表就会被删除！
    const query = `SELECT * FROM users WHERE id = ${userId}`;
    return db.execute(query);
}

// ========== 问题9：敏感数据日志 ==========
function logQueryResult(result) {
    // 🔴 查询结果直接打印到日志
    // 如果结果包含用户敏感信息，这些信息会被记录
    console.log("Query result:", JSON.stringify(result));

    // 🔴 错误日志中包含堆栈信息，可能泄露文件路径
    console.error("Query failed:", error);
}

4.3 调用子代理进行审查

现在，让我们的只读审查器来分析这些代码：



1

/code-reviewer

审查器会读取这些文件，然后输出类似以下的报告：



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44

📋 代码审查报告
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

🔴 Critical（严重问题 - 必须立即修复）

1. [auth.js:8] 硬编码API密钥
   - 问题：const API_SECRET_KEY = "sk-prod-..."
   - 风险：密钥泄露风险极高，一旦泄露可直接调用生产API
   - 建议：使用环境变量 process.env.API_SECRET_KEY

2. [auth.js:62] Eval代码注入
   - 问题：eval(`var user = ${input}`)
   - 风险：任意代码执行，服务器完全沦陷
   - 建议：完全禁止使用eval，使用JSON.parse()代替

3. [database.js:12] 数据库凭据硬编码
   - 问题：user: "admin", password: "Admin@123"
   - 风险：代码提交到GitHub后，任何人都能获取生产数据库访问权限
   - 建议：使用AWS Secrets Manager或HashiCorp Vault

4. [database.js:26] SQL注入漏洞
   - 问题：SELECT * FROM users WHERE id = ${userId}
   - 风险：攻击者可删除整个数据库或窃取所有用户数据
   - 建议：使用参数化查询

⚠️ Warnings（警告 - 需要关注）

1. [auth.js:14] 弱密码验证
   - 问题：只检查长度，不验证复杂度
   - 风险：用户可能设置"123456"这样的弱密码
   - 建议：添加大小写、数字、特殊字符要求

2. [auth.js:22] Token可预测
   - 问题：使用Date.now()生成Token
   - 风险：攻击者可以预测其他用户的Token
   - 建议：使用crypto.randomBytes(32).toString('hex')

💡 Suggestions（建议 - 可优化）

1. [auth.js:33] 使用crypto.timingSafeEqual
   - 建议：密码比较应防止时序攻击

2. [auth.js:43] 日志中的密码泄露
   - 建议：移除日志中的敏感字段，或使用脱敏处理

4.4 验证只读特性：让它修复看看

05. 进阶扩展：构建影响面分析代理

只读型子代理的威力远不止代码审查。让我们看另一个场景——影响面分析。

当你修改了一个底层公共模块，如何快速知道这次修改会影响到哪些上游服务和业务逻辑？

5.1 创建影响面分析代理



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

---
name: impact-analyzer
description: Analyze the potential impact of code changes on the system. Use when you need to understand downstream effects, service dependencies, and SLA risks.
tools: Read, Grep, Glob, Bash
model: sonnet
skills: dependency-graph
---

# Impact Analyzer Agent

你是一位系统架构师，专注于追踪代码变更的影响范围。

## 核心能力

- 追踪调用链：从变更点向上追溯所有依赖方
- 识别下游影响：这次修改会影响哪些服务/模块
- SLA风险评估：变更是否可能违反服务等级协议
- 回滚方案建议：提供安全的回滚路径

## 严格限制

- 只分析，不修改
- 不执行任何会产生副作用的命令
- 不访问生产环境的敏感数据

## 输出结构

1. **影响链路图**：用文字描述的调用链
2. **受影响服务列表**：按优先级排序
3. **风险评估**：高/中/低
4. **建议行动**：是否需要通知相关团队

5.2 Skill配置：链路拓扑注入

为了让影响面分析更准确，我们需要通过Skill把链路拓扑和历史事故信息注入到上下文中：



1
2
3
4
5

.claude/skills/dependency-graph/
├── SKILL.md
└── references/
    ├── service-map.json
    └── incident-history.md

Skill和Sub-agent的关系是这样的：

概念	类比	职责
Skill	SOP模板	如何做（步骤、命令、输出结构）
Sub-agent	岗位说明书	谁来做（角色、边界、口吻、工具权限）

关键点：子代理不会自动继承主对话中可用的Skill，必须在配置文件的skills字段显式列出。

06. 决策框架：什么时候该创建子代理？

现在你知道了如何创建只读型子代理。但更重要的前置问题是：什么时候应该创建子代理？

6.1 创建子代理的决策树



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

需要权限隔离吗？
├── 是 → 强烈推荐创建子代理
└── 否 → 继续判断

输出噪声很高吗？
├── 是 → 强烈推荐创建子代理
└── 否 → 继续判断

需要领域专家角色吗？
├── 是 → 视情况创建子代理
└── 否 → 继续判断

只是想定制一个Prompt？
├── 是 → 使用Skill更合适
└── 否 → 继续判断

想在特定事件时触发？
├── 是 → 使用Hook更合适
└── 否 → 继续判断

需要跨服务/跨仓库视角？
├── 是 → 强烈推荐创建子代理
└── 否 → 可能不需要子代理

6.2 子代理 vs Skill vs Hook

场景	推荐方案	原因
需要权限隔离（只读）	Sub-agent	通过工具限制强制约束
复用一段prompt	Skill	更轻量、直接嵌入上下文
特定事件触发检查	Hook	自动拦截、条件执行
复杂的多代理协作	Sub-agent	独立上下文、状态隔离

07. 2026年的治理框架：AI代码治理三板斧

回到文章开头那个灵魂拷问：如何防止AI"顺手"帮你做你不想让它做的事？

AI Code Governance框架（2026版） 提供了三个层面的治理策略：

08. 总结：让AI成为你的守门员，而不是万能钥匙

回到文章开头那个场景。

凌晨两点，你盯着屏幕上的commit，后背发凉。

你让AI看代码，AI帮你改了。

这不是AI的错。这是**你没说清楚"只能看"**的错。

只读型子代理的价值：

1. 安全隔离：AI只能看，不能动，风险边界清晰
2. 职责单一：审查就是审查，不兼职"热心帮你修"
3. 可预测：无论谁调用这个代理，行为模式一致
4. 可审计：所有操作都有记录，都是只读

一行配置，改变AI的行为边界：



1

tools: Read, Grep, Glob, Bash  # 就是这行配置，让AI从"万能钥匙"变成"专业守门员"

这就是最小权限原则的威力。

📢 写在最后：留一个思考题给你

今天的文章给了你构建只读型审计代理的完整方法论。但我更想问你的是：

在你当前的团队工作流中，有没有哪个环节特别需要"只能看、不能改"的AI角色？

也许是：

• 生产环境的配置审计？
• 敏感日志的合规检查？
• 代码依赖的安全扫描？

欢迎在评论区分享你的场景。

如果这篇文章帮你理清了思路，收藏+点赞是对我最大的支持。

下期见。

关注我，获取更多AI工程实践干货。🚀