你有没有遇到过这种情况:让 AI 帮你修一个 bug,它修完了,但忘记跑测试;让它写个功能,它跳过了规划直接开干;让它创建 PR,描述写得跟没写一样。每次运行结果都不一样,全靠今天模型"心情好不好"。Archon,一个正在 GitHub 热榜爬升的开源项目,就是专门来治这个病的。

AI 编程这两年:越来越强,也越来越不可控 🤔
说一个 2026 年程序员的日常:
早上打开电脑,启动 Claude Code,说"帮我修一下 GitHub Issue #42"。AI 风驰电掣,十分钟后代码出来了,PR 也创好了。你很满意,点开一看——测试没跑,commit message 乱写,PR 描述几乎是空白。
这不是 AI 不够聪明,这是 AI 缺乏"流程约束"。
大模型的本质是概率性的。每次你说"修这个 bug",它执行哪些步骤、忘记哪些步骤,取决于上下文、模型状态、你说话的方式……总之,充满随机性。这在个人项目里顶多让人抓狂,在团队协作里就是灾难——你没办法保证 AI 每次都走同一套流程,更没办法让它的行为被审计、被追溯。
“Vibe Coding”(氛围式编程)这个词,描述的就是这种松散的人机协作模式。一时爽快,但难以规模化。
行业里已经开始有所认识:确定性 + AI 的混合架构才是正解。让 AI 在创意节点(规划、生成、审查)发挥智能,用确定性节点(测试、Linter、Git 操作)做保障。
而 Archon,就是把这套架构落地的工程化工具。
Archon 是什么:AI 编程的 GitHub Actions 🔧
Archon 的官方定位是 “首个开源的 AI 编码套件构建器(Harness Builder)”,一句话理解就是:
像 Dockerfile 标准化基础设施、GitHub Actions 标准化 CI/CD 一样,Archon 要标准化 AI 编码工作流。
这个类比非常精准。Dockerfile 出现之前,每个项目的部署流程都是靠"老人口口相传",靠"知道这台机器有什么坑"。Dockerfile 把环境变成了代码,从此部署变得可复现、可分享、可版本化。
GitHub Actions 出现之前,CI/CD 是少数人才懂的"神秘仪式"。Actions 让每个团队都能把测试、构建、发布流程固化成 YAML 文件,一键触发。
Archon 想做的,就是把 AI 编程的流程也固化下来。
你在 .archon/workflows/ 目录下写一个 YAML 文件,定义好"规划→实现→测试→代码审查→创建 PR"这套流程,把它提交到 Git 仓库。从此,团队里任何人、任何工具触发这个任务,跑的都是完全一样的序列。

它到底怎么运作:拆开看看核心机制 ⚙️
Archon 的设计哲学可以用三个词概括:确定、隔离、可组合。
1. YAML 工作流:把流程变成代码
这是 Archon 的灵魂。一个典型的工作流长这样:
# .archon/workflows/build-feature.yamlnodes: - id: plan prompt: "探索代码库,创建实现计划" - id: implement depends_on: [plan] loop: prompt: "读取计划,实现下一个任务,运行验证" until: ALL_TASKS_COMPLETE fresh_context: true - id: run-tests depends_on: [implement] bash: "bun run validate" # 确定性节点,没有 AI - id: review depends_on: [run-tests] prompt: "对照计划审查所有变更,修复问题" - id: approve depends_on: [review] loop: prompt: "展示变更供审查,处理反馈" until: APPROVED interactive: true # 等待人工输入 - id: create-pr depends_on: [approve] prompt: "推送变更并创建拉取请求"注意这里的设计细节:
run-tests节点用bash而不是prompt,这是一个纯确定性节点,AI 不参与,直接跑命令。 implement节点有loop,AI 会一直循环实现→验证,直到所有任务完成。 approve节点有interactive: true,流程会暂停,等你review,你提出意见它就继续修,直到你满意。
AI 只在需要智能的地方介入,其他地方全是确定性的机器执行。 这就是 Archon 最核心的设计思路。
2. Git Worktree 隔离:五件事同时跑,互不干扰
传统 AI 编码助手有一个隐患:所有任务都在同一个工作目录里跑。你让它修 bug,同时又让它加功能,两个任务的代码改动会互相污染。
Archon 为每一次工作流运行创建一个独立的 Git Worktree——相当于一个全新的、隔离的工作空间。
你可以同时跑:修 Issue #42、实现新功能 A、做 PR 代码审查……五个任务并行,各自在独立的分支上,完全不冲突。
这对团队来说非常重要。以前 AI 编程基本是"串行"的,一个任务没跑完不敢启下一个。现在你可以真正实现并发 AI 任务。
3. 人工审批门:人 + AI 的协作而非替代
Archon 没有试图做"全自动无人值守"。它的哲学是 “Fire and forget”,但这里的"forget"不是字面意义上的完全放手——
你踢开一个任务,去做别的事,等它完成;但在关键节点(比如 approve),它会暂停、等你审查,你提反馈,它修改,直到你点"通过"。
这是一个成熟的工程化思维视角:AI 填充智能,人类把控关卡。不过度依赖 AI,也不让 AI 完全替代人的判断。
17 个内置工作流:拆箱即用的开发自动化 📦
Archon 内置了 17 个预设工作流,覆盖日常开发的主要场景:
- archon-fix-github-issue
:分类 Issue → 调查/规划 → 实现 → 验证 → PR → 智能审查 → 自动修复 - archon-idea-to-pr
:功能想法 → 规划 → 实现 → 验证 → PR → 5 并行审查者 → 修复 - archon-smart-pr-review
:分类 PR 复杂度 → 针对性审查 → 综合发现 - archon-comprehensive-pr-review
:多 Agent 并行审查(5 个审查者) - archon-resolve-conflicts
:检测合并冲突 → 分析双方 → 解决 → 验证 → 提交 - archon-architect
:架构扫描,降低复杂度,改善代码库健康状况 - archon-refactor-safely
:安全重构,带类型检查钩子和行为验证
这些工作流是最好的"学习素材"——你可以先用它们,然后把它们复制到自己仓库的 .archon/workflows/ 目录,按自己团队的规范修改,形成团队专属的流程。
工作流即团队共识。一旦 commit 进仓库,所有人跑的都是同一套流程,新人也能快速上手 AI 编码的"正确姿势"。
使用体验:真的有那么丝滑吗?
安装极其简单,一行命令搞定:
curl -fsSL https://archon.diy/install | bash装完之后,去你的项目目录,打开 Claude Code,直接说:
用 archon 修一下 Issue #42Archon 会自动:
识别用哪个工作流(有路由器) 帮你命名分支(如 archon/fix-issue-42)创建隔离的 Worktree 一步步执行节点,实时展示进度 在需要你参与的节点等你
整个过程在 Web Dashboard 上可以实时监控,也能在 Telegram、Slack 里触发和接收通知。
Web UI 包含几个核心页面:
- Chat
:实时流式对话,工具调用可视化 - Dashboard
:运行中/历史工作流的监控中心 - Workflow Builder
:可视化拖拽 DAG 工作流编辑器 - Workflow Execution
:任意工作流的分步进度视图
最有意思的是 Sidebar——它聚合了来自所有平台的对话:CLI 触发的、Telegram 发的、Slack 的、GitHub Issue 自动触发的,统一在一个地方看。

与"提示工程"的本质区别 🆚
有人可能会问:我用 CLAUDE.md / RULES.md 约束 AI 不也一样吗?
不一样,差很多。
CLAUDE.md 是给 AI 的系统级说明,类似"背景介绍",是软性约束——AI 可以遵守,也可以在输出中"忘记"。
Archon 的 YAML 工作流是硬性结构。run-tests 节点就是要运行 bun run validate,这条命令不管 AI 怎么想,都会执行。approve 节点就是要等人类输入,没有"AI 自行决定跳过"的可能。
这是**提示工程(Prompt Engineering)和套件工程(Harness Engineering)**的根本区别:
提示工程:你影响 AI 的输出概率分布 套件工程:你控制 AI 可以做什么、不能做什么、什么时候做
前者是概率性的,后者是确定性的。
正如 Archon 自己说的:“The structure is deterministic and owned by you.”(结构是确定的,并且由你掌控。)
开源社区与生态 🌐
Archon 由 Cole Medin 创建,MIT License 完全开源,代码托管在 GitHub(coleam00/Archon)。
项目有两个值得关注的发展方向:
一是平台集成。除了 CLI 和 Web UI,Archon 已经支持接入 Telegram、Slack、Discord 和 GitHub Webhooks。这意味着你的团队可以在日常沟通工具里触发 AI 编码任务,甚至可以让 GitHub 上的新 Issue 自动触发修复工作流。
二是工作流生态。每个团队都可以把自己的工作流提交到社区,未来有望形成类似 npm、Docker Hub 的工作流市场——你的问题,有没有人已经定义好了完美的 AI 流程?
官方文档站 archon.diy 有一本 10 章的《Archon 之书》教程,从零到精通地讲解如何定义工作流、如何部署、如何接入各平台。对于想深入的朋友,值得认真读一读。
写在最后:我们真正需要的不是更强的 AI,而是更好的控制 🎯
回到最开始的问题:AI 写代码为什么不可控?
不是因为 AI 不够聪明,而是因为我们给它的任务没有足够的结构。
你对一个新入职的员工说"去修那个 bug",他大概也会丢三落四。成熟的团队会给他一个 Checklist,一套审查流程,一个发布规范。这些"结构"本身就是智慧的结晶,不会因为换了人(或换了 AI)就失效。
Archon 做的,就是把这种智慧结晶成 YAML,让 AI 在你设计的流程里运转,而不是在它的概率空间里漫游。
让 AI 做 AI 擅长的事(思考、生成、评审),让工程来做工程的事(验证、隔离、可追溯)。
这不只是一个工具的进化,这是一种思维方式的转变:从"用 AI"到"管理 AI",从"氛围编程"到"工程化 AI 协作"。
如果你的团队已经在用 Claude Code、Cursor、Windsurf 等工具,但苦于每次结果都不一样、流程难以标准化,Archon 值得花半小时试一试。
GitHub 地址:https://github.com/coleam00/Archon官方文档:https://archon.diy
夜雨聆风