AI 写代码靠＂心情＂?这个开源项目要把它变成流水线

你有没有遇到过这种情况：让 AI 帮你修一个 bug，它修完了，但忘记跑测试；让它写个功能，它跳过了规划直接开干；让它创建 PR，描述写得跟没写一样。每次运行结果都不一样，全靠今天模型"心情好不好"。Archon，一个正在 GitHub 热榜爬升的开源项目，就是专门来治这个病的。

AI 编程这两年：越来越强，也越来越不可控 🤔

说一个 2026 年程序员的日常：

早上打开电脑，启动 Claude Code，说"帮我修一下 GitHub Issue #42"。AI 风驰电掣，十分钟后代码出来了，PR 也创好了。你很满意，点开一看——测试没跑，commit message 乱写，PR 描述几乎是空白。

这不是 AI 不够聪明，这是 AI 缺乏"流程约束"。

大模型的本质是概率性的。每次你说"修这个 bug"，它执行哪些步骤、忘记哪些步骤，取决于上下文、模型状态、你说话的方式……总之，充满随机性。这在个人项目里顶多让人抓狂，在团队协作里就是灾难——你没办法保证 AI 每次都走同一套流程，更没办法让它的行为被审计、被追溯。

“Vibe Coding”（氛围式编程）这个词，描述的就是这种松散的人机协作模式。一时爽快，但难以规模化。

行业里已经开始有所认识：确定性 + AI 的混合架构才是正解。让 AI 在创意节点（规划、生成、审查）发挥智能，用确定性节点（测试、Linter、Git 操作）做保障。

而 Archon，就是把这套架构落地的工程化工具。

Archon 是什么：AI 编程的 GitHub Actions 🔧

Archon 的官方定位是 “首个开源的 AI 编码套件构建器（Harness Builder）”，一句话理解就是：

像 Dockerfile 标准化基础设施、GitHub Actions 标准化 CI/CD 一样，Archon 要标准化 AI 编码工作流。

这个类比非常精准。Dockerfile 出现之前，每个项目的部署流程都是靠"老人口口相传"，靠"知道这台机器有什么坑"。Dockerfile 把环境变成了代码，从此部署变得可复现、可分享、可版本化。

GitHub Actions 出现之前，CI/CD 是少数人才懂的"神秘仪式"。Actions 让每个团队都能把测试、构建、发布流程固化成 YAML 文件，一键触发。

Archon 想做的，就是把 AI 编程的流程也固化下来。

你在 .archon/workflows/ 目录下写一个 YAML 文件，定义好"规划→实现→测试→代码审查→创建 PR"这套流程，把它提交到 Git 仓库。从此，团队里任何人、任何工具触发这个任务，跑的都是完全一样的序列。

它到底怎么运作：拆开看看核心机制 ⚙️

Archon 的设计哲学可以用三个词概括：确定、隔离、可组合。

1. YAML 工作流：把流程变成代码

这是 Archon 的灵魂。一个典型的工作流长这样：

# .archon/workflows/build-feature.yamlnodes:  - id: plan    prompt: "探索代码库，创建实现计划"  - id: implement    depends_on: [plan]    loop:      prompt: "读取计划，实现下一个任务，运行验证"      until: ALL_TASKS_COMPLETE      fresh_context: true  - id: run-tests    depends_on: [implement]    bash: "bun run validate"   # 确定性节点，没有 AI  - id: review    depends_on: [run-tests]    prompt: "对照计划审查所有变更，修复问题"  - id: approve    depends_on: [review]    loop:      prompt: "展示变更供审查，处理反馈"      until: APPROVED      interactive: true        # 等待人工输入  - id: create-pr    depends_on: [approve]    prompt: "推送变更并创建拉取请求"

注意这里的设计细节：

run-tests 节点用 bash 而不是 prompt
，这是一个纯确定性节点，AI 不参与，直接跑命令。
implement 节点有 loop
，AI 会一直循环实现→验证，直到所有任务完成。
approve 节点有 interactive: true
，流程会暂停，等你review，你提出意见它就继续修，直到你满意。

AI 只在需要智能的地方介入，其他地方全是确定性的机器执行。 这就是 Archon 最核心的设计思路。

2. Git Worktree 隔离：五件事同时跑，互不干扰

传统 AI 编码助手有一个隐患：所有任务都在同一个工作目录里跑。你让它修 bug，同时又让它加功能，两个任务的代码改动会互相污染。

Archon 为每一次工作流运行创建一个独立的 Git Worktree——相当于一个全新的、隔离的工作空间。

你可以同时跑：修 Issue #42、实现新功能 A、做 PR 代码审查……五个任务并行，各自在独立的分支上，完全不冲突。

这对团队来说非常重要。以前 AI 编程基本是"串行"的，一个任务没跑完不敢启下一个。现在你可以真正实现并发 AI 任务。

3. 人工审批门：人 + AI 的协作而非替代

Archon 没有试图做"全自动无人值守"。它的哲学是 “Fire and forget”，但这里的"forget"不是字面意义上的完全放手——

你踢开一个任务，去做别的事，等它完成；但在关键节点（比如 approve），它会暂停、等你审查，你提反馈，它修改，直到你点"通过"。

这是一个成熟的工程化思维视角：AI 填充智能，人类把控关卡。不过度依赖 AI，也不让 AI 完全替代人的判断。

17 个内置工作流：拆箱即用的开发自动化 📦

Archon 内置了 17 个预设工作流，覆盖日常开发的主要场景：

archon-fix-github-issue
：分类 Issue → 调查/规划 → 实现 → 验证 → PR → 智能审查 → 自动修复
archon-idea-to-pr
：功能想法 → 规划 → 实现 → 验证 → PR → 5 并行审查者 → 修复
archon-smart-pr-review
：分类 PR 复杂度 → 针对性审查 → 综合发现
archon-comprehensive-pr-review
：多 Agent 并行审查（5 个审查者）
archon-resolve-conflicts
：检测合并冲突 → 分析双方 → 解决 → 验证 → 提交
archon-architect
：架构扫描，降低复杂度，改善代码库健康状况
archon-refactor-safely
：安全重构，带类型检查钩子和行为验证

这些工作流是最好的"学习素材"——你可以先用它们，然后把它们复制到自己仓库的 .archon/workflows/ 目录，按自己团队的规范修改，形成团队专属的流程。

工作流即团队共识。一旦 commit 进仓库，所有人跑的都是同一套流程，新人也能快速上手 AI 编码的"正确姿势"。

使用体验：真的有那么丝滑吗？

安装极其简单，一行命令搞定：

curl -fsSL https://archon.diy/install | bash

装完之后，去你的项目目录，打开 Claude Code，直接说：

用 archon 修一下 Issue #42

Archon 会自动：

识别用哪个工作流（有路由器）
帮你命名分支（如 archon/fix-issue-42）
创建隔离的 Worktree
一步步执行节点，实时展示进度
在需要你参与的节点等你

整个过程在 Web Dashboard 上可以实时监控，也能在 Telegram、Slack 里触发和接收通知。

Web UI 包含几个核心页面：

Chat
：实时流式对话，工具调用可视化
Dashboard
：运行中/历史工作流的监控中心
Workflow Builder
：可视化拖拽 DAG 工作流编辑器
Workflow Execution
：任意工作流的分步进度视图

最有意思的是 Sidebar——它聚合了来自所有平台的对话：CLI 触发的、Telegram 发的、Slack 的、GitHub Issue 自动触发的，统一在一个地方看。

与"提示工程"的本质区别 🆚

有人可能会问：我用 CLAUDE.md / RULES.md 约束 AI 不也一样吗？

不一样，差很多。

CLAUDE.md 是给 AI 的系统级说明，类似"背景介绍"，是软性约束——AI 可以遵守，也可以在输出中"忘记"。

Archon 的 YAML 工作流是硬性结构。run-tests 节点就是要运行 bun run validate，这条命令不管 AI 怎么想，都会执行。approve 节点就是要等人类输入，没有"AI 自行决定跳过"的可能。

这是**提示工程（Prompt Engineering）和套件工程（Harness Engineering）**的根本区别：

提示工程：你影响 AI 的输出概率分布
套件工程：你控制 AI 可以做什么、不能做什么、什么时候做

前者是概率性的，后者是确定性的。

正如 Archon 自己说的：“The structure is deterministic and owned by you.”（结构是确定的，并且由你掌控。）

开源社区与生态 🌐

Archon 由 Cole Medin 创建，MIT License 完全开源，代码托管在 GitHub（coleam00/Archon）。

项目有两个值得关注的发展方向：

一是平台集成。除了 CLI 和 Web UI，Archon 已经支持接入 Telegram、Slack、Discord 和 GitHub Webhooks。这意味着你的团队可以在日常沟通工具里触发 AI 编码任务，甚至可以让 GitHub 上的新 Issue 自动触发修复工作流。

二是工作流生态。每个团队都可以把自己的工作流提交到社区，未来有望形成类似 npm、Docker Hub 的工作流市场——你的问题，有没有人已经定义好了完美的 AI 流程？

官方文档站 archon.diy 有一本 10 章的《Archon 之书》教程，从零到精通地讲解如何定义工作流、如何部署、如何接入各平台。对于想深入的朋友，值得认真读一读。

写在最后：我们真正需要的不是更强的 AI，而是更好的控制 🎯

回到最开始的问题：AI 写代码为什么不可控？

不是因为 AI 不够聪明，而是因为我们给它的任务没有足够的结构。

你对一个新入职的员工说"去修那个 bug"，他大概也会丢三落四。成熟的团队会给他一个 Checklist，一套审查流程，一个发布规范。这些"结构"本身就是智慧的结晶，不会因为换了人（或换了 AI）就失效。

Archon 做的，就是把这种智慧结晶成 YAML，让 AI 在你设计的流程里运转，而不是在它的概率空间里漫游。

让 AI 做 AI 擅长的事（思考、生成、评审），让工程来做工程的事（验证、隔离、可追溯）。

这不只是一个工具的进化，这是一种思维方式的转变：从"用 AI"到"管理 AI"，从"氛围编程"到"工程化 AI 协作"。

如果你的团队已经在用 Claude Code、Cursor、Windsurf 等工具，但苦于每次结果都不一样、流程难以标准化，Archon 值得花半小时试一试。

GitHub 地址：https://github.com/coleam00/Archon官方文档：https://archon.diy