第十九章: Vibe Coding 与 AI 工具生态
本章是整个培训中最”接地气”的一章。我们将探讨 AI 如何改变软件开发的方式,以及作为产品技术人员,如何利用这些工具提升自己的工作效率。
19.1 Vibe Coding 概念与哲学
19.1.1 Andrej Karpathy 的原始定义

2025 年 2 月,前特斯拉 AI 总监、OpenAI 联合创始人 Andrej Karpathy 在 Twitter 上首次提出了 “Vibe Coding” 这个概念:
“There’s a new kind of coding I call ‘vibe coding’, where you fully give in to the vibes, embrace exponentials, and forget that the code even exists.”
“有一种新的编程方式我称之为’氛围编程’,你完全沉浸在感觉中,拥抱指数级变化,甚至忘记代码的存在。”
Karpathy 描述的场景是:他用 AI 工具(如 Cursor + Claude)开发项目时,基本不看代码,只是用自然语言描述想要什么,然后让 AI 生成、修改、调试代码。他说:”我大概只看了 30% 的代码,其他时候我只是告诉它’这里有个 bug,帮我修一下’。”
这不是夸张,而是真实发生的开发方式转变。
19.1.2 “看氛围编程”的本质
传统编程模式:
需求 → 设计 → 编码(逐行写)→ 调试 → 测试程序员需要:- 记住语法- 理解框架- 手写每一行代码- 自己排查错误
Vibe Coding 模式:
意图 → AI 生成 → 审核/调整 → AI 修复 → 验收开发者需要:- 清晰表达意图- 判断生成结果对不对- 指出哪里需要修改- 验证最终效果
本质变化:从”写代码”到”对话”
传统:程序员: 写 function fetchUserData() { ... }Vibe Coding:人类: "帮我写一个获取用户数据的函数,从 /api/users 接口获取,需要错误处理"AI: [生成代码]人类: "加上 loading 状态的处理"AI: [修改代码]人类: "好,看起来没问题"
19.1.3 Vibe Coding 对软件开发流程的根本改变
变化一:技能要求转移

|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
变化二:开发速度提升
真实案例数据: – 基础 CRUD 功能:从 2 小时 → 15 分钟 – 前端页面开发:从 1 天 → 2 小时 – 简单工具脚本:从 30 分钟 → 5 分钟
变化三:门槛降低
以前:非程序员几乎不可能写代码 现在:任何能清晰表达需求的人,都可以通过 AI 生成代码
这就是为什么 Vibe Coding 对产品技术特别重要。
19.1.5 Vibe Coding 常见陷阱与反模式
Vibe Coding 虽然强大,但也有其限制和陷阱。不了解这些,可能会踩很多坑:

|
|
|
|
|
|---|---|---|---|
| 盲目信任 AI 代码 |
|
|
必须审查关键逻辑
|
| 安全漏洞盲区 |
|
|
安全检查清单
|
| 技术债积累 |
|
|
先建立规范再写代码
|
| 过度依赖补全 |
|
|
保持基础功
|
| 上下文断裂 |
|
|
提供完整上下文
|
防坑核心原则:
Vibe Coding 不是“无脑编程”,而是“更高级的编程”✘ 错误心态:AI 生成了,能跑就行,不用看✔ 正确心态:AI 生成了,我要理解它为什么这样写,并判断是否合适你的角色从“代码产出者”变成了“代码审核者”,要求更高,不是更低
19.1.6 对产品技术的意义
从前:
PM 写需求文档 → 交给开发 → 等待排期 → 等待开发 → 验收想验证一个想法?- 最少需要 1 个开发- 最少需要 1-2 周时间- 想法可能在等待中失去时效性
现在:
PM 用 AI 快速原型 → 验证想法 → 确定可行再交给开发想验证一个想法?- 打开 Claude / Cursor- 花 30 分钟生成原型- 立即看到效果并决策
PM 可以自己做的事情:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
19.1.7 Harness Engineering:从 Vibe 到生产
Vibe Coding 让开发变得前所未有的高效,但当 AI Agent 开始处理生产环境代码、自动化部署、甚至自主修复系统故障时,一个问题浮出水面:如何让 AI 在失控时能够被及时制止?
2026 年初,一个新兴工程学科正在快速崛起——Harness Engineering(缰绳工程)。它回答的正是这个问题。
1. 什么是 Harness Engineering
定义: Harness Engineering 是专注于设计系统、约束和反馈机制,使 AI Agent 在生产环境中可靠且可控地运行的新兴工程学科。
核心比喻:马与缰绳
┌─────────────────────────────────────────────────────────────────┐│ Harness Engineering │├─────────────────────────────────────────────────────────────────┤│ ││ 马 (Horse) 缰绳 (Harness) 骑手 (Rider) ││ ┌─────┐ ┌──────────┐ ┌───────┐ ││ │ AI │◄───────────►│ 系统约束 │◄──────────►│ 工程师 │ ││ │模型 │ 执行任务 │ 安全边界 │ 设计/监控 │ │ ││ └─────┘ └──────────┘ └───────┘ ││ │ │ │ ││ │ │ │ ││ ▼ ▼ ▼ ││ 强大的能力 可控的边界 明智的决策 ││ 指数级产出 防止失控 价值判断 ││ │└─────────────────────────────────────────────────────────────────┘
- 马 = AI 模型
:拥有强大的能力,可以指数级提升产出 - 缰绳 = 系统约束
:定义边界,防止失控 - 骑手 = 工程师
:做出价值判断,决定何时加速、何时刹车
关键特征: Harness Engineering 不是关于 Agent 本身,而是围绕 Agent 的完整基础设施——包括权限控制、错误恢复、可观测性、人工检查点等。
2. 从 Vibe Coding 到 Harness Engineering 的进化
进化路径:
2025 ───────────────────────────────────────────────────► 2026Vibe Coding Spec Coding Harness Engineering(氛围编程) (规范编程) (缰绳工程)│ │ ││ "让 AI 写代码" │ "让 AI 按规范写代码" │ "让 AI 安全地自主运行"│ │ │▼ ▼ ▼• 单次对话生成代码 • 结构化需求文档 • 完整的 Agent 基础设施• 人工审查后使用 • 明确的验收标准 • 自动化的约束与反馈• 适合原型开发 • 适合迭代开发 • 适合生产环境自主运行
三种范式的对比:
|
|
|
|
|
|---|---|---|---|
| 核心问题 |
|
|
|
| 人的角色 |
|
|
|
| AI 的角色 |
|
|
|
| 关键技能 |
|
|
|
| 适用场景 |
|
|
|
| 风险控制 |
|
|
|
3. Harness Engineering 的五大核心支柱
支柱一:工具编排(Tool Orchestration)
定义 AI Agent 可以使用的工具集和权限边界:
# tool-manifest.yaml 示例agent_id: production-deployertools:- name: git_operationsallowed_commands:- "git status"- "git diff"- "git log --oneline -20"forbidden_commands:- "git push --force"- "git reset --hard"- name: file_operationsallowed_paths:- "/app/src/**"- "/app/config/**"forbidden_paths:- "/etc/**"- "/var/secrets/**"- name: api_callsallowed_endpoints:- "https://api.staging.company.com/**"forbidden_endpoints:- "https://api.production.company.com/**"
支柱二:防护栏与安全约束(Guardrails)
多层防护机制,防止 Agent 越界:
┌─────────────────────────────────────────────────────────────────┐│ Guardrails 层级架构 │├─────────────────────────────────────────────────────────────────┤│ ││ Level 1: 权限边界 (Permission Boundaries) ││ ├─ 文件系统访问限制 ││ ├─ 网络请求白名单 ││ └─ 命令执行沙箱 ││ ││ Level 2: 输出验证 (Output Validation) ││ ├─ 代码静态分析 ││ ├─ 敏感信息扫描 ││ └─ 合规性检查 ││ ││ Level 3: 架构约束 (Architecture Constraints) ││ ├─ 禁止直接操作生产数据库 ││ ├─ 必须通过 CI/CD 流水线部署 ││ └─ 关键操作需双人确认 ││ ││ Level 4: 速率限制 (Rate Limiting) ││ ├─ API 调用频率控制 ││ ├─ 文件修改数量限制 ││ └─ 连续运行时间限制 ││ │└─────────────────────────────────────────────────────────────────┘
支柱三:错误恢复与反馈循环(Error Recovery & Feedback Loops)
当 Agent 出错时,系统如何自动恢复:
|
|
|
|
|---|---|---|
| 自动重试 |
|
|
| 自验证循环 |
|
|
| 回滚机制 |
|
|
| 循环检测 |
|
|
# 反馈循环示例:自验证 Agentclass SelfValidatingAgent:def execute_task(self, task):max_attempts = 3for attempt in range(max_attempts):# 1. 执行任务result = self.agent.run(task)# 2. 自我验证validation = self.validator.check(result)if validation.passed:return result# 3. 根据反馈调整task = self.refine_task(task, validation.feedback)# 4. 多次失败后人工介入return self.escalate_to_human(task)
支柱四:可观测性(Observability)
全面了解 Agent 的运行状态:
┌─────────────────────────────────────────────────────────────────┐│ Agent 可观测性体系 │├─────────────────────────────────────────────────────────────────┤│ ││ 关键日志 (Critical Logs) ││ ├── 决策日志:Agent 为什么做出这个选择? ││ ├── 工具调用日志:调用了什么工具,参数是什么? ││ ├── 上下文日志:Agent 看到了什么上下文信息? ││ └── 错误日志:失败时的完整堆栈和状态 ││ ││ 监控指标 (Key Metrics) ││ ├── 任务成功率 / 失败率 ││ ├── 平均执行时间 / Token 消耗 ││ ├── 工具调用频率分布 ││ └── 人工介入率 ││ ││ 异常检测 (Anomaly Detection) ││ ├── 异常行为模式识别 ││ ├── 偏离基线的操作序列 ││ └── 敏感操作实时告警 ││ │└─────────────────────────────────────────────────────────────────┘
支柱五:人工介入检查点(Human-in-the-Loop Checkpoints)
在关键环节保留人工决策权:
|
|
|
|
|---|---|---|
| 显式批准门 |
|
|
| 定期审查 |
|
|
| 监控告警 |
|
|
| 回滚请求 |
|
|
4. 实战案例
案例一:OpenAI Codex 的 Harness 设计
OpenAI 在 2025 年推出的 Codex Agent 展示了企业级 Harness 的最佳实践:
AGENTS.md 文件机制:├── 项目上下文定义│ ├── 技术栈说明│ ├── 架构约束│ └── 编码规范│├── 可复现开发环境│ ├── Docker 容器定义│ ├── 依赖锁定│ └── 初始化脚本│└── CI/CD 机制约束 ├── 必须通过测试才能合并 ├── 代码审查要求 └── 自动部署流水线
数据: OpenAI 内部使用 Codex,3 个工程师平均每天产出 3.5 个 merged PR,同时保持零生产事故。
案例二:Anthropic Claude Code 的安全设计
Claude Code 作为终端 Agent,内置多层 Harness:
Claude Code 安全机制:├── 默认安全模式│ ├── 敏感操作前确认(删除文件、执行命令等)│ ├── 文件修改预览│ └── 网络请求白名单│├── 自动快照│ ├── 每次会话前自动备份│ ├── 可随时回滚到之前状态│ └── 修改历史可视化│└── Hooks 系统 ├── 预执行钩子:检查危险操作 ├── 后执行钩子:验证执行结果 └── 告警钩子:异常行为通知
案例三:Cursor Rules 的约束工程
Cursor 通过 .cursor/rules 配置文件实现项目级 Harness:
// .cursor/rules 示例{"rules": [{"name": "禁止直接修改生产配置","pattern": "**/production/**","action": "warn","message": "生产环境配置修改需要双人确认"},{"name": "强制测试覆盖","pattern": "**/*.py","condition": "new_file","require": "test_file_exists","action": "block"},{"name": "SQL 注入检查","pattern": "execute.*\\+.*format","action": "error","message": "检测到潜在 SQL 注入风险,请使用参数化查询"}]}
5. 建立第一个 Agent Harness(6步框架)
Step 1: 定义 Agent 权限范围
# Agent 权限清单模板## 身份与职责- Agent 名称:_________________- 主要职责:_________________- 运行环境:开发 / 测试 / 生产## 允许的操作- [ ] 读取代码文件- [ ] 修改代码文件- [ ] 执行测试命令- [ ] 部署到测试环境- [ ] 部署到生产环境- [ ] 访问数据库- [ ] 调用外部 API## 禁止的操作- [ ] 直接修改生产数据库- [ ] 删除关键配置文件- [ ] 绕过代码审查直接合并- [ ] 访问用户隐私数据
Step 2: 创建配置文件
根据使用的工具选择配置方式:
配置方式选择:├── OpenAI Codex → AGENTS.md├── Anthropic Claude → CLAUDE.md├── Cursor → .cursorrules 或 .cursor/rules/└── 自定义 Agent → 自定义 YAML/JSON
Step 3: 建立反馈循环
# 最小可行反馈循环示例class AgentHarness:def run_with_feedback(self, task):# 1. 执行前记录self.logger.log_start(task)try:# 2. 执行任务result = self.agent.execute(task)# 3. 自动验证validation = self.validate(result)if not validation.success:# 4. 自动修复或人工介入if validation.can_auto_fix:result = self.auto_fix(result, validation.issues)else:result = self.escalate(task, validation.issues)# 5. 记录结果self.logger.log_complete(task, result)return resultexcept Exception as e:# 6. 异常处理self.logger.log_error(task, e)return self.handle_error(task, e)
Step 4: 添加防护栏
从最关键的开始,逐步完善:
防护栏实施优先级:P0 (立即实施)├── 文件系统沙箱(限制可访问路径)├── 命令白名单(只允许安全命令)└── 敏感信息扫描(防止泄露密钥)P1 (本周实施)├── 代码静态分析集成├── 网络请求限制└── 操作频率限制P2 (本月实施)├── 架构约束检查├── 合规性自动审计└── 异常行为检测
Step 5: 实现可观测性
# 最小可观测性配置observability:logging:level: INFOformat: "[{timestamp}] [{level}] [Agent:{agent_id}] {message}"output: ["file", "stdout", "otel"]metrics:- name: task_success_ratetype: counterlabels: [agent_id, task_type]- name: task_durationtype: histogramlabels: [agent_id, task_type]- name: tool_call_counttype: counterlabels: [agent_id, tool_name]alerting:- condition: "task_success_rate < 0.95"severity: warningchannel: slack- condition: "sensitive_operation_detected"severity: criticalchannel: pagerduty
Step 6: 设计人工检查点
人工检查点决策树:是否需要人工批准?├── 操作类型检查│ ├── 生产环境部署? → 需要批准│ ├── 删除数据? → 需要批准│ ├── 修改安全策略? → 需要批准│ └── 其他操作? → 继续检查│├── 影响范围检查│ ├── 影响 > 100 个用户? → 需要批准│ ├── 涉及支付/财务? → 需要批准│ └── 高风险时段? → 需要批准│└── 置信度检查 ├── Agent 置信度 < 0.9? → 需要批准 └── 历史失败率 > 5%? → 需要批准
6. 对产品经理的启示
Harness Engineering 的兴起,对产品经理意味着什么?
启示一:从参与者到架构师的角色转变
产品经理角色演进:传统 PM Vibe Coding PM Harness PM│ │ ││ 定义需求 │ 与 AI 协作生成方案 │ 设计 Agent 系统架构│ 等待开发 │ 快速原型验证 │ 定义约束与检查点│ 验收成果 │ 迭代优化 │ 监督 Agent 运行│ │ │▼ ▼ ▼被动等待 主动参与 系统设计周期长 周期短 可持续扩展
启示二:工程思维变得必须
产品经理需要掌握的新技能:
|
|
|
|
|---|---|---|
| 系统约束设计 |
|
|
| 反馈循环设计 |
|
|
| 可观测性设计 |
|
|
| 风险评估 |
|
|
启示三:团队扩展成为可能
传统团队扩展:1 个 PM 管理 5-8 个工程师(沟通成本高,难以扩展)Harness Engineering 团队:1 个 PM 管理 3 个工程师 + 5 个 AI Agent├── Agent 1: 负责竞品监控和报告├── Agent 2: 负责数据分析和洞察├── Agent 3: 负责原型生成和测试├── Agent 4: 负责文档撰写和更新└── Agent 5: 负责用户反馈分析
启示四:可靠性成为竞争力
在 AI 能力趋同的时代,谁能更安全、更可靠地使用 AI,谁就有竞争优势:
竞争力维度转变:以前:谁的 AI 能力更强?现在:谁能更安全地发挥 AI 能力?Harness Engineering 成熟度 = 竞争优势├── 更高的自动化程度├── 更低的故障率├── 更快的问题恢复└── 更好的合规性
19.2 AI 编程工具深度对比
19.2.1 Cursor



产品定位: AI-first 的代码编辑器,基于 VS Code 打造,深度集成 AI 能力。
核心功能:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tab 补全示例:
# 你输入:def calculate_order_total(items):# AI 预测并建议(灰色显示):total = 0for item in items:total += item.price * item.quantityreturn total# 按 Tab 采纳,按 Esc 忽略
Cmd+K 示例:
# 选中这段代码:def get_user(id):return db.query(User).filter_by(id=id).first()# 按 Cmd+K,输入:"加上缓存,用 Redis"# AI 生成:def get_user(id):cache_key = f"user:{id}"cached = redis.get(cache_key)if cached:return json.loads(cached)user = db.query(User).filter_by(id=id).first()if user:redis.setex(cache_key, 3600, json.dumps(user.to_dict()))return user
Composer 示例:
用户输入:"帮我创建一个用户注册功能,包括:1. 前端表单组件(React)2. 后端 API 接口(FastAPI)3. 数据库模型(SQLAlchemy)"Composer 同时创建/修改:- frontend/components/RegisterForm.tsx- backend/api/auth.py- backend/models/user.py
优势: – Tab 补全体验最流畅 – Composer 多文件编辑很强大 – 支持多种模型(GPT-4、Claude) – 代码库索引,理解项目上下文
局限: – 基于 VS Code,对纯新手仍有学习成本 – 订阅费用 $20/月 – 复杂重构需要多次迭代
适用场景: – 日常编程开发 – 有一定编程基础的用户 – 需要深度代码编辑的场景
19.2.2 Windsurf(Codeium)
产品定位: Codeium 推出的 AI IDE,主打 Cascade(瀑布式 AI 开发流)。
Cascade 功能:
Cascade 是 Windsurf 最核心的差异化功能。它不只是单次 AI 补全,而是一个持续的 AI “思考流”:
传统 AI 补全:用户请求 → AI 回答 → 结束Cascade 模式:用户请求 → AI 分析 → AI 执行 → AI 验证 → AI 发现新问题 → AI 继续处理 → ...(自动持续,直到任务完成)
Cascade 示例:
用户:"帮我修复这个组件的样式问题"Cascade 自动执行:1. 分析组件代码,理解问题2. 修改 CSS3. 发现相关组件也需要调整4. 自动修改相关组件5. 检查是否有其他引用6. 生成修改总结
与 Cursor 的差异:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
适用场景: – 需要大范围代码重构 – 希望 AI 更主动的用户 – 想尝试免费 AI 编程的用户
19.2.3 GitHub Copilot
产品定位: GitHub 官方 AI 编程助手,微软出品,深度集成 GitHub 生态。
核心功能:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
Copilot Workspace(重点):
这是 GitHub 2024 年推出的革命性功能:
传统流程:Issue(需求)→ 人工分析 → 人工写代码 → 提交 PRCopilot Workspace:Issue(需求)→ AI 分析 → AI 规划修改方案 → AI 生成代码 → 人工审核 → 提交 PR
示例流程:
1. 你在 GitHub 上创建 Issue: "修复:用户注册时邮箱验证不生效"2. 点击 "Open in Copilot Workspace"3. AI 自动分析: - 定位到 auth/register.py - 发现邮箱验证逻辑被跳过 - 分析相关测试文件4. AI 生成修改计划: - 修复 register.py 第 45 行 - 添加测试用例 - 更新文档5. AI 生成代码变更6. 你审核并一键创建 PR
GitHub 生态整合优势: – 直接从 Issue 开始工作 – 自动生成 PR 描述 – 代码审查建议 – 和 GitHub Actions 集成
适用场景: – 重度 GitHub 用户 – 团队协作开发 – 开源项目贡献
19.2.4 Claude Code
产品定位: Anthropic 推出的终端 AI Agent,可以直接操作你的电脑执行编程任务。
核心特点:
与其他工具不同,Claude Code 运行在终端中,是一个真正的 Agent:
# 启动 Claude Code$ claude# 和 Claude 对话You: 帮我创建一个新的 React 项目,包含用户认证功能Claude: 好的,我来帮你创建。让我先执行几个步骤...[Claude 自动执行]$ npx create-react-app my-app$ cd my-app$ npm install firebase react-router-dom[创建多个文件][修改配置]Claude: 项目已创建完成。我做了以下事情:1. 创建了 React 项目2. 安装了 Firebase 和 React Router3. 创建了 Login、Register、Dashboard 组件4. 配置了路由和 Auth Context需要我启动开发服务器吗?
能力范围: – 读写文件 – 执行命令 – 创建项目 – 调试代码 – 运行测试
与其他工具的区别:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
适用场景: – 项目初始化 – 环境配置 – 批量文件处理 – 习惯终端操作的用户
19.2.5 Qoder
产品定位: 基于多 Agent 协作的 AI 编程系统。
核心特点:
Qoder 的设计理念是模拟真实的开发团队:
传统 AI 编程工具:一个 AI 干所有事情Qoder:多个专业 Agent 分工协作:- PM Agent:分析需求,拆解任务- Architect Agent:设计架构- Developer Agent:编写代码- Reviewer Agent:代码审查- Tester Agent:测试验证
协作示例:
用户:"帮我开发一个博客系统"PM Agent:- 分析需求,拆解为用户故事- 确定 MVP 范围- 创建任务列表Architect Agent:- 选择技术栈- 设计系统架构- 定义接口规范Developer Agent:- 根据任务列表编写代码- 遇到问题向 PM 确认Reviewer Agent:- 审查代码质量- 提出改进建议Tester Agent:- 编写测试用例- 运行测试
适用场景: – 复杂项目开发 – 需要高质量输出的场景 – 企业级开发流程
19.2.6 工具对比总结表
|
|
|
|
|
|
|
|---|---|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
19.2.7 数据安全对比
在选择 AI 编程工具时,数据安全是一个不容忽视的维度,尤其是涉及核心代码或商业机密时:
|
|
|
|
|
|---|---|---|---|
| Cursor |
|
|
|
| Windsurf |
|
|
|
| GitHub Copilot |
|
|
|
| Claude Code |
|
|
|
⚠️ 安全提示:涉及核心代码、商业机密、客户数据时,必须评估数据安全风险。建议: – 使用企业版工具(通常有更严格的数据处理协议) – 开启隐私模式(如有) – 敏感代码考虑使用本地模型方案
19.2.8 国内可用性与离线能力
对于国内用户,工具的可用性和网络依赖也是重要考量因素:
国内可用性:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 国产替代 |
|
|
离线使用能力:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 完全离线方案 |
|
|
我的建议:
- 日常编程
:Cursor(体验最好) - GitHub 重度用户
:Copilot(生态集成) - 想省钱
:Windsurf 免费版 - 复杂项目
:Qoder - 环境配置/脚本任务
:Claude Code
19.2.9 AI 编码工具的伦理与合规
除了功能和数据安全,AI 编码工具还涉及一些重要的伦理和合规问题,特别是在企业环境中:
代码版权问题
|
|
|
|
|---|---|---|
| 训练数据版权 |
|
|
| 生成代码归属 |
|
|
| 无意复制受保护代码 |
|
|
企业数据安全
风险场景:1. 代码上传到云端 AI 服务,可能被存储或用于训练2. 核心业务逻辑、专有算法被发送到第三方3. 代码中包含的 API Key、数据库密码等敏感信息泄露真实案例:某企业开发者将包含客户数据处理逻辑的代码发送给 AI,代码中包含真实数据库连接信息和客户数据样例,导致客户数据安全事件。
开源许可证合规
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
企业 AI 编码工具使用政策建议
# AI 编码工具使用规范(模板)## 1. 工具准入- 只允许使用 IT 部门审批的 AI 编码工具- 优先选择提供企业版、数据不用于训练的工具- 涉密项目考虑本地化部署方案## 2. 数据安全- 禁止将生产环境数据、密钥、凭证发送给 AI- 禁止将客户数据、个人信息发送给 AI- 检查代码中的敏感信息后再发送## 3. 版权合规- AI 生成的代码需要进行原创性检查- 关键代码片段需要经过代码查重- 记录 AI 辅助开发的部分,便于源代码审计## 4. 使用培训- 所有开发者必须完成 AI 工具安全使用培训- 定期更新培训内容,覆盖新风险和最佳实践
19.3 Claude Artifacts / Claude Projects / Claude Work 的产品逻辑分析
19.3.1 Claude Artifacts
是什么?
Claude Artifacts 是 Anthropic 在 2024 年推出的功能,让 Claude 可以在对话中直接生成并预览: – 代码(HTML/CSS/JS/React) – 文档(Markdown) – 图表(Mermaid/SVG) – 可交互组件
传统方式:Claude: "这是一个按钮组件的代码:```jsxfunction Button() { return <button>Click</button> }```"用户:只能看代码,看不到效果Artifacts 方式:Claude: [生成 Artifact]用户:直接在右侧面板看到渲染后的按钮,可以点击交互
产品设计分析:
为什么这个功能改变了交互范式?
- 从”描述”到”展示”
-
以前:AI 只能用文字描述 -
现在:AI 可以直接展示结果 -
用户理解成本大幅降低
-
即时反馈循环
-
看到效果 → 提出修改 → 看到新效果 -
迭代速度从”小时级”变成”秒级”
-
降低专业门槛
-
不懂代码的人也能”看懂”最终效果 -
PM 可以直接生成原型
使用示例:
用户:"帮我设计一个产品定价页面,有三个套餐"Claude 生成 Artifact:[右侧面板直接显示一个完整的定价页面]- 三列卡片布局- 推荐套餐高亮- 价格和功能对比- 可点击的"立即购买"按钮用户:"中间那个套餐改成深蓝色"Claude 更新 Artifact:[页面实时更新]
Artifacts 的能力边界:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
19.3.2 Claude Projects
是什么?
Claude Projects 是 Claude 的”项目空间”功能,让你可以:
- 上传项目文件
:把相关文档、代码、资料上传到项目中 - 设置自定义指令
:告诉 Claude 这个项目的背景、规范、偏好 - 持续对话
:Claude 会记住项目上下文
为什么需要 Projects?
没有 Projects 时:每次对话你都要重新解释:- "我们在做一个电商项目"- "使用 React + Node.js"- "设计风格是简约风"- "文档用中文写"...有了 Projects:一次配置,永久生效Claude 自动了解所有背景
配置示例:
# 项目:电商后台管理系统## 技术栈- 前端:React 18 + TypeScript + Ant Design- 后端:Node.js + Nest.js- 数据库:PostgreSQL## 代码规范- 使用 ESLint + Prettier- 组件使用函数式写法- 变量命名用 camelCase- 文件命名用 kebab-case## 文档规范- 注释用中文- README 用中文- 接口文档用 OpenAPI 格式## 上传文件- 产品需求文档.pdf- 数据库设计.sql- API 接口定义.yaml
团队协作场景:
场景:产品团队使用 Claude Projects项目配置:- 上传:PRD、设计稿、竞品分析- 指令:使用公司文档模板,输出用中文团队成员 A(PM):"帮我写一下这个功能的用户故事"Claude:[基于 PRD 内容生成用户故事]团队成员 B(设计师):"帮我分析一下这个竞品的设计特点"Claude:[基于上传的竞品分析生成设计洞察]团队成员 C(开发):"根据 PRD,帮我设计数据库表结构"Claude:[基于需求文档生成表结构]
19.3.3 Claude Work(Computer Use)
是什么?
Claude Work 是 Anthropic 的”Computer Use”能力,让 Claude 可以: – 看到你的屏幕 – 控制鼠标和键盘 – 操作桌面应用
这是真正的”桌面 Agent”。
当前能力:
能做的事情:✓ 打开网页,浏览和搜索✓ 填写表单✓ 操作办公软件(Excel、Word)✓ 执行简单的重复性任务示例:用户:"帮我在 Excel 里整理这个数据,按日期排序,然后生成图表"Claude:[自动打开 Excel,选中数据,排序,插入图表]
当前局限:
做不好的事情:✗ 复杂的多步骤任务(容易中途出错)✗ 需要精确点击的操作(可能点错位置)✗ 实时变化的界面(网页动态加载)✗ 需要等待的操作(不确定等多久)典型问题:- 弹窗挡住了目标按钮,AI 不知道怎么处理- 网页加载慢,AI 以为加载完了就点击- 多个相似按钮,AI 可能点错
产品设计分析:
Computer Use 代表了 AI Agent 的一个重要方向:从”生成内容”到”执行任务”。
进化路径:第一阶段:AI 生成内容- "帮我写一封邮件" → 输出文本第二阶段:AI 生成可执行代码- "帮我写个脚本" → 输出代码,用户执行第三阶段:AI 直接执行- "帮我发一封邮件" → AI 直接操作邮件客户端发送
对产品经理的启示:
未来的 AI 产品可能不只是”对话界面”,而是能直接操作各种软件的”数字员工”。
19.4 产品技术 AI 提效实践
19.4.1 原型设计

场景描述: 验证产品想法时,需要快速制作可交互的原型。
传统方式 vs AI 方式:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
使用方法:
方法一:Claude Artifacts 生成
Prompt 示例:"帮我设计一个移动端的待办事项 App 原型,包含以下功能:1. 任务列表页面:显示待办和已完成2. 添加任务:输入框 + 日期选择3. 任务详情:可编辑标题、描述、截止日期4. 底部导航:首页、日历、设置风格:简约风,主色调蓝色请用 React 生成可交互的原型"Claude 会生成一个完整的可交互原型,你可以:- 直接在 Artifact 中点击操作- 复制代码在本地运行- 继续对话修改细节
方法二:v0.dev 生成
v0.dev 是 Vercel 推出的 AI UI 生成工具,专门用于生成前端组件:
访问 v0.dev,输入:"Design a pricing page for a SaaS product with three tiers:Free, Pro ($29/month), and Enterprise (custom pricing).Include feature comparison and a FAQ section."v0 会生成多个设计方案,你可以:- 选择喜欢的方案- 继续迭代修改- 一键复制 React 代码
完整 Prompt 模板:
# 原型设计 Prompt 模板## 基本信息- 产品类型:[Web/移动端/桌面端]- 目标用户:[用户画像]- 核心场景:[主要使用场景]## 页面需求### 页面1:[页面名称]- 功能点1:[描述]- 功能点2:[描述]- 交互说明:[关键交互]### 页面2:[页面名称]...## 设计要求- 风格:[简约/商务/活泼/...]- 配色:[主色调]- 参考:[参考产品或设计]## 技术要求- 框架:React / HTML / Vue- 需要可交互:是/否- 需要响应式:是/否
19.4.2 PRD 撰写
场景描述: 撰写产品需求文档,需要结构完整、逻辑清晰。
AI 辅助方法:
方法一:大纲生成
Prompt:"我要写一个[功能名称]的 PRD,目标用户是[用户画像],核心场景是[场景描述]。请帮我生成 PRD 的大纲框架,包含:1. 背景与目标2. 用户故事3. 功能需求4. 非功能需求5. 数据埋点6. 风险与依赖"然后逐章让 AI 帮你填充内容。
方法二:需求转化
Prompt:"以下是用户反馈和业务需求:[粘贴原始需求/用户反馈]请帮我转化为标准的用户故事格式:- 作为[角色],我想要[功能],以便[价值]- 验收标准- 优先级评估"
方法三:竞品功能对比
Prompt:"我在做[功能名称]的设计,竞品 A 是这样做的:[描述],竞品 B 是这样做的:[描述]。请帮我分析:1. 各自的设计理念2. 优缺点对比3. 对我们产品的建议"
PRD 撰写 Prompt 示例:
# PRD 撰写助手你是一位资深产品技术,请帮我撰写以下功能的 PRD。## 功能概述功能名称:智能客服机器人产品:XX 电商 App目标:降低人工客服压力,提升用户问题解决效率## 需求来源- 客服团队反馈:70% 问题是重复性问题- 用户调研:用户希望 7x24 小时服务- 竞品分析:主要竞品均已上线智能客服## 请输出以下内容### 1. 产品背景与目标[请补充]### 2. 用户故事与场景[请补充至少 5 个用户故事]### 3. 功能需求列表[请按优先级 P0/P1/P2 分类]### 4. 功能详细设计[请针对每个 P0 功能详细描述:- 功能说明- 交互流程- 异常处理- 验收标准]### 5. 数据埋点需求[请列出需要埋点的事件]### 6. 非功能需求[性能、安全、兼容性等]
19.4.3 数据分析
场景描述: 需要从数据库查询数据,分析趋势,生成可视化图表。
AI 辅助方法:
方法一:SQL 生成
Prompt:"我有一张订单表 orders,字段包括:- order_id: 订单ID- user_id: 用户ID- amount: 金额- status: 状态(paid/pending/cancelled)- created_at: 创建时间请帮我写 SQL:1. 查询过去 30 天每天的订单量和 GMV2. 按支付状态分布统计3. 找出订单金额 TOP 100 的用户"
方法二:数据解读
Prompt:"以下是过去一周的数据:| 日期 | DAU | 订单量 | GMV | 转化率 ||------|-----|--------|-----|--------|| 周一 | 10000 | 500 | 50000 | 5.0% || 周二 | 12000 | 480 | 48000 | 4.0% |...请帮我分析:1. 整体趋势2. 异常点3. 可能的原因假设4. 建议的跟进动作"
方法三:图表生成(Code Interpreter)
在 ChatGPT Code Interpreter 或 Claude 中:Prompt:"请帮我用 Python 生成以下数据的可视化图表:[粘贴数据]要求:1. 折线图显示趋势2. 柱状图对比各渠道3. 饼图显示占比4. 风格简洁专业5. 输出 PNG 图片"
数据分析 Prompt 模板:
# 数据分析 Prompt 模板## 数据背景- 数据来源:[数据库/Excel/API]- 时间范围:[起止时间]- 数据维度:[用户/订单/行为]## 分析目标我想了解:[具体问题]## 数据结构表名:[表名]字段:- [字段1]:[类型],[说明]- [字段2]:[类型],[说明]...## 期望输出1. SQL 查询语句2. 数据解读3. 可视化图表4. 行动建议
19.4.4 用户调研
场景一:访谈大纲设计
Prompt:"我要做一次用户访谈,目标是了解用户在[场景]下的痛点和需求。目标用户:[用户画像]访谈时长:30 分钟请帮我设计访谈大纲,包括:1. 暖场问题(2-3 个)2. 核心问题(5-7 个)3. 深挖追问(每个核心问题的追问方向)4. 结尾问题(1-2 个)注意:- 问题要开放式,避免引导性- 按照由浅入深的顺序- 注意时间分配"
场景二:问卷设计
Prompt:"我要设计一份用户满意度问卷,目标是评估[产品/功能]的用户体验。目标收集:100 份填写时长:3-5 分钟请帮我设计问卷,包括:1. 基本信息题(2-3 题)2. 使用频率和场景(2-3 题)3. 满意度评分(NPS + 各维度评分)4. 问题和建议(开放题)要求:- 题目简洁明了- 选项覆盖完整- 避免专业术语"
场景三:反馈分析
Prompt:"以下是用户反馈原文(来自 App Store 评论):[粘贴 20-30 条评论]请帮我:1. 对反馈进行分类(功能需求/Bug/体验问题/好评)2. 提取高频关键词3. 总结 TOP 5 问题4. 给出优先级建议"
19.4.5 竞品分析
场景:自动化竞品信息收集和对比
Prompt:"请帮我分析以下竞品的[功能名称]功能:竞品列表:- 产品 A:[简介]- 产品 B:[简介]- 产品 C:[简介]分析维度:1. 功能完整度2. 用户体验3. 技术实现方式4. 定价策略5. 差异化特点输出格式:- 对比表格- 各产品优缺点- 对我们的建议"
竞品分析 Prompt 进阶版:
# 竞品分析 Prompt## 分析目标我们正在做[产品/功能],需要分析竞品的实现方式和差异化策略。## 竞品信息### 竞品 A:[名称]- 官网:[URL]- 简介:[一句话描述]- 目标用户:[用户画像]### 竞品 B:[名称]...## 分析框架### 1. 功能对比请从以下维度对比:- 核心功能列表- 功能深度- 使用流程### 2. 体验对比- 上手难度- 界面设计- 关键流程体验### 3. 商业模式- 定价策略- 付费功能差异- 目标市场### 4. 技术实现(如果可见)- 使用的技术栈- 性能表现- 开放能力(API等)## 期望输出1. 多维度对比表格2. 各竞品的核心竞争力3. 市场定位分析4. 对我们产品的差异化建议
19.5 AI 工具评估框架
19.5.1 五维评估模型

当面对众多 AI 工具时,我们需要一个系统的评估框架来做选择:
┌─────────────────────────────────────────────────────────────────────────┐│ AI 工具五维评估模型 │├─────────────────────────────────────────────────────────────────────────┤│ ││ 能力 Capability ││ ▲ ││ /│\ ││ / │ \ ││ / │ \ ││ / │ \ ││ 数据安全 ◄────────────┼────────────► 成本 Cost ││ Security │ ││ \ │ / ││ \ │ / ││ \ │ / ││ \│/ ││ ▼ ││ 集成度 Integration ─────── 学习曲线 Learning ││ │└─────────────────────────────────────────────────────────────────────────┘
维度一:能力(Capability)
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
维度二:成本(Cost)
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
维度三:集成度(Integration)
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
维度四:学习曲线(Learning Curve)
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
维度五:数据安全(Security)
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
19.5.2 评估模板
┌─────────────────────────────────────────────────────────────────────────┐│ AI 工具评估打分表 │├─────────────────────────────────────────────────────────────────────────┤│ 工具名称:________________ 评估日期:________________ ││ 评估人:________________ 使用场景:________________ │├─────────────────────────────────────────────────────────────────────────┤│ ││ 一、能力评估 (满分 25 分) 小计:___/25 ││ ┌────────────────────────────────────────────────────────────────────┐││ │ 1. 能解决我的核心问题吗? ___/5 │││ │ 说明:_________________________________________________ │││ │ 2. 输出质量满意吗? ___/5 │││ │ 说明:_________________________________________________ │││ │ 3. 准确性/错误率可接受吗? ___/5 │││ │ 说明:_________________________________________________ │││ │ 4. 响应速度可接受吗? ___/5 │││ │ 说明:_________________________________________________ │││ │ 5. 场景覆盖范围广吗? ___/5 │││ │ 说明:_________________________________________________ │││ └────────────────────────────────────────────────────────────────────┘││ ││ 二、成本评估 (满分 25 分) 小计:___/25 ││ ┌────────────────────────────────────────────────────────────────────┐││ │ 订阅费:___/月 按量费:___/调用 其他费:___ │││ │ 预估月成本:___ │││ │ 成本合理性评分: ___/25 │││ └────────────────────────────────────────────────────────────────────┘││ ││ 三、集成度评估 (满分 20 分) 小计:___/20 ││ ┌────────────────────────────────────────────────────────────────────┐││ │ 1. 与现有工作流的契合度 ___/5 │││ │ 2. 与常用工具的集成度 ___/5 │││ │ 3. 数据导入导出便捷性 ___/5 │││ │ 4. API/自动化支持 ___/5 │││ └────────────────────────────────────────────────────────────────────┘││ ││ 四、学习成本评估 (满分 15 分) 小计:___/15 ││ ┌────────────────────────────────────────────────────────────────────┐││ │ 1. 上手难度(1最难,5最易) ___/5 │││ │ 2. 文档和教程质量 ___/5 │││ │ 3. 社区/技术支持 ___/5 │││ └────────────────────────────────────────────────────────────────────┘││ ││ 五、安全评估 (满分 15 分) 小计:___/15 ││ ┌────────────────────────────────────────────────────────────────────┐││ │ 1. 数据存储和隐私政策 ___/5 │││ │ 2. 合规认证 ___/5 │││ │ 3. 企业级安全选项 ___/5 │││ └────────────────────────────────────────────────────────────────────┘││ │├─────────────────────────────────────────────────────────────────────────┤│ 总分:___/100 ││ ││ 评估结论: ││ [ ] ≥80 分:强烈推荐 ││ [ ] 60-79 分:可以使用,有一定限制 ││ [ ] 40-59 分:谨慎考虑,可能不适合 ││ [ ] <40 分:不推荐 ││ ││ 综合建议:________________________________________________ │└─────────────────────────────────────────────────────────────────────────┘
19.6 产品技术的 AI 工具箱完整推荐
19.6.1 日常办公
|
|
|
|
|
|---|---|---|---|
| Claude |
|
|
|
| ChatGPT |
|
|
|
| Gemini |
|
|
|
| 豆包/Kimi |
|
|
|
使用建议: – 日常首选:Claude(思考深度)或 ChatGPT(生态丰富) – 中文场景:豆包(字节)或 Kimi(月之暗面) – 长文档处理:Claude(200K 上下文)或 Gemini(1M 上下文)
19.6.2 编程开发
|
|
|
|
|
|---|---|---|---|
| Cursor |
|
|
|
| GitHub Copilot |
|
|
|
| Claude Code |
|
|
|
| Replit |
|
|
|
使用建议: – 想学编程的 PM:Replit(零配置在线使用) – 有编程基础的 PM:Cursor(体验最好) – 只想快速出原型:Claude Artifacts + v0.dev
19.6.3 设计原型
|
|
|
|
|
|---|---|---|---|
| v0.dev |
|
|
|
| Claude Artifacts |
|
|
|
| Galileo AI |
|
|
|
| Figma AI |
|
|
|
使用建议: – 快速验证想法:Claude Artifacts(最快) – 需要完整组件:v0.dev(专业) – 已经用 Figma:Figma AI(无缝集成)
19.6.4 数据分析
|
|
|
|
|
|---|---|---|---|
| ChatGPT Code Interpreter |
|
|
|
| Jupyter AI |
|
|
|
| Pandas AI |
|
|
|
| SQL Chat |
|
|
|
使用建议: – 非技术 PM:ChatGPT Code Interpreter(最简单) – 会 Python 的 PM:Jupyter AI – 只需要 SQL:SQL Chat 或 ChatGPT 生成 SQL
19.6.5 文档处理
|
|
|
|
|
|---|---|---|---|
| Notion AI |
|
|
|
| Gamma |
|
|
|
| Tome |
|
|
|
| Grammarly |
|
|
|
使用建议: – 写 PPT:Gamma(效果最好) – 写文档:Notion AI(如果用 Notion)或 Claude – 英文润色:Grammarly
19.6.6 协作沟通
|
|
|
|
|
|---|---|---|---|
| Otter.ai |
|
|
|
| 飞书妙记 |
|
|
|
| Fireflies.ai |
|
|
|
| Loom AI |
|
|
|
使用建议: – 国内团队:飞书妙记 – 国际团队:Otter.ai 或 Fireflies.ai – 异步沟通多:Loom
19.6.7 PM AI 工具箱速查表
┌─────────────────────────────────────────────────────────────────────────┐│ 产品技术 AI 工具箱速查 │├─────────────────────────────────────────────────────────────────────────┤│ ││ 📝 文档写作 ││ └─ Claude / ChatGPT + Notion AI ││ ││ 📊 数据分析 ││ └─ ChatGPT Code Interpreter ││ ││ 🎨 原型设计 ││ └─ Claude Artifacts + v0.dev ││ ││ 💻 快速编程 ││ └─ Cursor / Replit ││ ││ 📑 PPT 制作 ││ └─ Gamma ││ ││ 🔍 竞品研究 ││ └─ Claude + Perplexity ││ ││ 🎙️ 会议纪要 ││ └─ 飞书妙记 / Otter.ai ││ ││ 📧 邮件沟通 ││ └─ ChatGPT + Grammarly ││ │└─────────────────────────────────────────────────────────────────────────┘
本章小结
本章我们深入探讨了 Vibe Coding 和 AI 工具生态:
-
Vibe Coding 的本质:从”写代码”变成”对话”,用自然语言驱动软件开发。
-
主流 AI 编程工具对比:Cursor(日常首选)、GitHub Copilot(GitHub 用户)、Windsurf(自动化)、Claude Code(终端操作)、Qoder(复杂项目)。
-
Claude 产品线分析:Artifacts(即时预览)、Projects(项目上下文)、Work(桌面操作)。
-
PM 提效实践:原型设计、PRD 撰写、数据分析、用户调研、竞品分析的 AI 辅助方法。
-
工具评估框架:能力、成本、集成度、学习曲线、数据安全五个维度。
-
完整工具箱推荐:覆盖日常办公、编程、设计、数据、文档、协作等场景。
核心建议: – 选择 2-3 个核心工具深度使用,而不是浅尝辄止 – 从最高频的场景开始应用 AI – 持续关注工具更新,AI 工具迭代非常快
下一章预告: 我们将探讨 AI 伦理、安全与治理——这是每个 AI 产品技术人员必须了解的底线和红线。
夜雨聆风