6 步搭建 AI 后端 Harness 工作流,Spring Boot 项目直接用

很多开发同学用 AI 写代码，刚开始都觉得爽。

丢一句话给 Cursor 或 Claude Code："帮我加一个订单查询接口。"几分钟后，Controller、Service、Repository 全出来了。

再过几分钟，问题也来了：参数校验没做，异常处理绕过了统一规范，事务边界写得很随意，DTO 和 Entity 混着用，权限校验漏了，测试也没有。

你让它改，它能改。改完又冒新问题。

于是很多人得出一个结论：AI 写代码还是不靠谱。

但我观察下来，大部分情况不是 AI 不行，是我们把它当成了自由发挥的外包——没给项目上下文，没给分层规则，没给接口规范，没给异常规范，也没给自动检查。AI 只能猜你的工程习惯。

这就像招了个执行力强的新人，但不给文档，不讲分层，不说权限模型，然后指望他一次写出生产级代码。不现实。

能把 AI 编程用起来的人，做的不是研究神奇 Prompt，而是搭一套 Harness——给 AI 套上缰绳、护栏和工作流，让它在设计好的轨道里跑。

好消息是，这事不需要大团队，也不需要复杂平台。一个 Spring Boot 项目，今天就能开始。

第一步：写一个 AGENTS.md

如果你只能做一件事，我建议先写这个。

AGENTS.md 本质上是给 AI 看的项目说明书。人类新人入职需要 onboarding 文档，AI 进你的代码仓库也需要上下文。

一个最小可用的版本长这样：


# AGENTS.md## 项目简介面向中小企业的订单管理系统，Spring Boot + Java 17 + MySQL + Redis## 仓库结构src/main/java/com/example/order/├── controller/   接口入口层，只做请求参数和响应封装├── service/      业务逻辑层├── repository/   数据访问层├── domain/       领域对象和实体├── dto/          入参对象├── vo/           出参对象├── config/       配置类└── common/       通用工具、异常、响应结构## 核心规则1. Controller 不写业务逻辑，只做参数校验、调用 Service、返回结果2. 所有入参必须使用 Bean Validation（@Valid、@NotNull、@NotBlank）3. Entity 不直接返回前端，必须转 VO4. 多表写入必须明确事务边界（@Transactional）5. 异常走统一处理，禁止 printStackTrace6. 新增核心业务逻辑必须补单元测试## 常用命令- 运行：mvn spring-boot:run- 测试：mvn test- 检查：mvn checkstyle:check- 打包：mvn clean package## 参考文档- 接口规范：docs/API.md- 数据库设计：docs/DATABASE.md- 异常码：docs/ERROR_CODE.md

别小看这个文件。它解决的是 AI 写代码时最高频的那些问题：不知道分层、不知道返回格式、不知道异常怎么处理、不知道能不能暴露 Entity、不知道什么时候该加事务。

写 AGENTS.md 有个诀窍：不要写一堆漂亮但没人遵守的空话，写你项目里真实踩过的坑。

比如这些就比"保持代码整洁"有用得多：

•
Controller 不能直接访问 Repository
•
新增接口必须补错误码
•
金额字段必须用 BigDecimal，禁用 double
•
数据库写操作要考虑幂等
•
用户数据接口必须校验登录态

规则越具体，AI 越容易执行。建议控制在几十行以内。

第二步：把规则变成自动检查

只写 AGENTS.md 还不够，文档是软约束，工具才是硬约束。

Spring Boot 项目可以从四件事起步：

Checkstyle — 统一代码风格

在 pom.xml 加这段：


<plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-checkstyle-plugin</artifactId><version>3.3.1</version><configuration><configLocation>google_checks.xml</configLocation><encoding>UTF-8</encoding><consoleOutput>true</consoleOutput><failsOnError>true</failsOnError></configuration><executions><execution><phase>verify</phase><goals><goal>check</goal></goals></execution></executions></plugin>

SpotBugs — 扫描潜在 Bug


<plugin><groupId>com.github.spotbugs</groupId><artifactId>spotbugs-maven-plugin</artifactId><version>4.8.6.2</version><configuration><effort>Max</effort><threshold>Medium</threshold></configuration></plugin>

JUnit — 给 AI 一个可验证的目标

别一上来追求 90% 覆盖率，先从最核心的业务逻辑开始：订单金额计算、退款规则、库存扣减、优惠券核销、状态机流转。

一个简单的 Service 测试：


classOrderServiceTest{privateOrderService orderService;@BeforeEachvoidsetUp(){        orderService =newOrderService();}@Testvoid 应该正确计算优惠券后的支付金额(){BigDecimal total =newBigDecimal("100.00");BigDecimal coupon =newBigDecimal("30.00");assertEquals(newBigDecimal("70.00"),            orderService.calculatePayAmount(total, coupon));}@Testvoid 优惠券金额为负数时应抛异常(){assertThrows(IllegalArgumentException.class,()->{            orderService.calculatePayAmount(newBigDecimal("100.00"),newBigDecimal("-1.00"));});}}

配好之后，AI 写完代码不是你凭感觉说"差不多"，而是跑这三条命令：


mvn testmvn checkstyle:checkmvn clean package

能过再进人工 Review，不能过先让 AI 自己修。

第三步：挂上 Git 提交前检查

有了检查和测试，下一步挂到 Git 流程里。Java 后端项目可以用 pre-commit：


# .pre-commit-config.yamlrepos:-repo: localhooks:-id: maven-testname: Run Maven Testentry: mvn testlanguage: systempass_filenames:false-id: maven-checkstylename: Run Checkstyleentry: mvn checkstyle:checklanguage: systempass_filenames:false

安装：pre-commit install

之后每次 git commit，系统会自动跑一轮基础检查。

这一步的价值在于：AI 写代码最大的问题不是完全不会写，而是经常写出"看着能跑但细节不稳"的代码。 提交前检查就是个最小质量闸门，拦住格式不统一、测试不过、构建失败这类低级问题。

第四步：别再用"许愿式开发"

很多人用 AI 写代码的流程是这样的：打开工具 → 输入"帮我做一个订单接口" → 全部接受 → 出问题再补救。

这种方式叫 Vibe Coding。问题是：设计和实现都交给 AI 了。但现阶段 AI 更适合做执行，不适合替你做业务判断和架构取舍。

后端开发里真正重要的往往不是"能不能写出接口"，而是这些事：

•
接口边界怎么定
•
事务边界放哪
•
异常怎么表达
•
权限在哪校验
•
幺等怎么处理
•
数据一致性怎么保证
•
哪些同步、哪些异步

这些判断不能完全丢给 AI。更稳的方式是：你负责设计，AI 负责实现。

花 5-10 分钟写清楚任务说明，比后面反复改省时间得多。比如这样：

任务：新增订单取消接口
目标：用户可取消自己未支付的订单接口：POST /api/orders/{orderId}/cancel
业务规则：
1.
只有 WAIT_PAY 状态可取消
2.
已支付/已发货/已取消不可重复取消
3.
取消后状态更新为 CANCELED
4.
锁定库存的需要释放
5.
整个流程必须在同一事务内完成
异常码：
•
ORDER_NOT_FOUND（订单不存在）
•
ORDER_ACCESS_DENIED（无权限）
•
ORDER_STATUS_NOT_ALLOWED（状态不允许）
改动范围：OrderController / OrderService / OrderRepository / InventoryService / ErrorCode / 对应测试不要动：支付回调逻辑、订单创建逻辑验证：mvn test → mvn checkstyle:check → mvn clean package

你看，这就跟一句"帮我写个取消订单接口"完全不一样了。任务越清楚，AI 走偏的概率越低。

第五步：建立人机循环

一个比较健康的 AI 后端开发节奏，我拆成五步：

① 你写任务说明

这一步别偷懒。任务说明是方向盘，不是装饰品。上面第四段的模板可以直接复用。

② 让 AI 读代码、改代码、跑测试

不用每行都盯着。AI 的价值就是替你干执行层的体力活。

③ 看 diff

重点看这几件事：Controller 有没有塞业务逻辑；事务边界合不合理；查询有没有性能风险；异常走没走统一错误码；权限漏没漏；Entity 有没有直接暴露；有没有动不该动的模块。

④ 跑验证命令

mvn test + mvn checkstyle:check + mvn clean package，有集成测试也一起跑。

⑤ 有问题写评论，让 AI 修

别一看到问题自己上手改。写成具体反馈扔回去：

•
"OrderController 不要写状态判断，移到 OrderService"
•
"cancelOrder 涉及状态更新和库存释放，加 @Transactional"
•
"不能直接返回 OrderEntity，转 OrderVO"
•
"别抛 RuntimeException，用 BusinessException + ErrorCode"

反馈越具体，下一轮越稳定。

这套循环跑顺之后，你的角色会变。不再是逐行搬砖，更像技术负责人：定义目标、制定边界、设计规则、验收结果。AI 干执行。这是比较合理的人机分工。

第六步：每周 15 分钟"后端园艺"

AI 用多了，代码库里会慢慢积累一些"能用但工程味不一致"的东西。建议每周留 15 分钟做轻量整理：

•

上周 AI 改过的 diff 看一眼

•

Controller 变胖了就把逻辑下沉 Service

•

重复查询抽 Repository 方法

•

异常码乱了就整理 ErrorCode

•

文档过时就更新 AGENTS.md

•

发现新的坏模式就写进项目规则

Harness 不是一次性配置，是持续演化的系统。每沉淀一条规则，少一次人工提醒，AI 执行就更稳一点。时间长了，这就是复利。

30 天实践路线

想动手的话，可以按这个节奏来：

时间	做什么
Day 1	写 AGENTS.md，补分层、接口规范、异常规范
Day 2	配 Checkstyle，统一基础代码风格
Day 3	补 Maven 测试和构建命令
Day 4-7	每天用 AI 完成一个小任务，记录它常犯的错
Day 8	把高频错误整理成 3-5 条规则写进 AGENTS.md
Day 9-14	继续用 AI 写代码，观察规则是否生效
Day 15	第一次"后端园艺"，清理 Controller 过重、异常不统一、重复查询
Day 16-21	尝试让 AI 先自查 diff 再输出修改说明
Day 22	配 CI，让测试和构建在远端自动跑
Day 23-28	新接口一律先写任务说明再交给 AI
Day 29	更新 AGENTS.md，补充一个月积累的新规则
Day 30	复盘：哪些任务适合 AI，哪些判断必须人来

30 天后你不一定有完美的系统，但能明显感觉到：AI 从一个随机发挥的聊天框，变成了一个可管理、可约束、可复用的工程助手。

最后说几句

AI 编程的分水岭，不是你用了哪个模型或买了哪个插件。而是你有没有意识到一件事：AI 更像一个执行力很强但需要明确规则的协作者，而不是替你承担所有设计判断的救世主。

不给上下文，它就猜；不给分层，Controller 就写成大杂烩；不给异常规范，随手抛 RuntimeException；不给事务边界，就可能写出半成功半失败的流程；不给检查，就把问题留给你。

所以别再死磕"一句神奇 Prompt 打天下"了。从今天开始做三件小事：

给 Spring Boot 项目写一个 AGENTS.md

配好 Checkstyle + JUnit + Maven 构建

每个接口先写清业务规则和验收标准，再交给 AI

这就是普通开发者的第一个 Harness 工作流。把你的判断沉淀成规则、文档和自动化流程，AI 就不再是灵感的玩具，而是能长期产生复利的生产工具。