AI Agent 实战手册:从工具栈到行业落地

AI Agent 已经过了只讲概念的阶段。

真正有价值的问题，不是“能不能让模型多聊几句”。

而是：

能不能接工具？

能不能管权限？

能不能守红线？

能不能评测上线？

能不能放进真实行业流程里跑起来？

这个开源项目做的，就是把 AI Agent 从“聊天框”推进到“行业工程”。

AI Agent 实战手册

GitHub：github.com/OnelongX/aiagent

公众号：实战复盘

微信号：IamOnelong

目前仓库已经沉淀：

22+ 篇 Agent 实战。

13+ 个行业场景验证。

多篇完整可跑代码。

从工具栈配置，到行业落地，再到跨行业平移。

一套骨架，撑住多个行业

这个项目最核心的判断是：

Claude Agent SDK 的工程模式是行业无关的。

真正变化的不是 Agent 骨架。

而是行业数据、工具接口、权限边界、评测指标和红线规则。

绿电、合同、客服、论文、法律、医疗、金融、制造，这些行业看起来差别很大。

但工程上都绕不开几个问题：

哪些事情必须走工具？

哪些事情不能交给 LLM 自由发挥？

哪些场景需要 Subagent 分工？

哪些边界必须用 Hook 拦住？

哪些指标下降就不能上线？

真正能落地的 Agent，靠工程纪律

仓库总结了 6 个行业无关的工程定律：

工具优先。数字、价格、状态全走工具，不让 LLM 瞎算。

权限在数据层。安全不能靠 Prompt 自觉。

Subagent 分工。不同任务用不同模型和不同角色，成本可控。

Hooks 守红线。价格、承诺、状态机这些边界要硬约束。

评测驱动。指标下跌，就应该阻断上线。

红线先于功能。高风险场景不能先进 LLM 再祈祷它别犯错。

从会用 AI，到会造 Agent

内容覆盖 Codex CLI、Claude 全家桶、opencode、Claude Agent SDK、LiteLLM、Qdrant、Rerank、RAGAS 等工具链。

它不是单纯罗列工具。

而是把工具放进真实场景里，回答一个更具体的问题：

一个可上线、可评测、可守边界的 Agent 系统，到底应该怎么搭？

适合谁看？

适合开发者。

适合产品经理。

适合行业数字化负责人。

也适合正在把 Agent 从 demo 推向真实业务的团队。

如果你正在做 AI Agent，但卡在工具调用、行业数据、权限控制、成本、评测、红线、上线边界这些问题上，这个仓库值得系统看一遍。

AI Agent 的门槛，正在从“会不会调用模型”，变成“能不能把行业 20 年的流程，拆成工具、Subagent、Hooks 和评测”。

GitHub 地址：

https://github.com/OnelongX/aiagent

公众号：实战复盘

微信号：IamOnelong