AI Agent 已经过了只讲概念的阶段。
真正有价值的问题,不是“能不能让模型多聊几句”。
而是:
能不能接工具?
能不能管权限?
能不能守红线?
能不能评测上线?
能不能放进真实行业流程里跑起来?
这个开源项目做的,就是把 AI Agent 从“聊天框”推进到“行业工程”。
AI Agent 实战手册
GitHub:github.com/OnelongX/aiagent
公众号:实战复盘
微信号:IamOnelong
目前仓库已经沉淀:
22+ 篇 Agent 实战。
13+ 个行业场景验证。
多篇完整可跑代码。
从工具栈配置,到行业落地,再到跨行业平移。
一套骨架,撑住多个行业
这个项目最核心的判断是:
Claude Agent SDK 的工程模式是行业无关的。
真正变化的不是 Agent 骨架。
而是行业数据、工具接口、权限边界、评测指标和红线规则。
绿电、合同、客服、论文、法律、医疗、金融、制造,这些行业看起来差别很大。
但工程上都绕不开几个问题:
哪些事情必须走工具?
哪些事情不能交给 LLM 自由发挥?
哪些场景需要 Subagent 分工?
哪些边界必须用 Hook 拦住?
哪些指标下降就不能上线?
真正能落地的 Agent,靠工程纪律
仓库总结了 6 个行业无关的工程定律:
工具优先。数字、价格、状态全走工具,不让 LLM 瞎算。
权限在数据层。安全不能靠 Prompt 自觉。
Subagent 分工。不同任务用不同模型和不同角色,成本可控。
Hooks 守红线。价格、承诺、状态机这些边界要硬约束。
评测驱动。指标下跌,就应该阻断上线。
红线先于功能。高风险场景不能先进 LLM 再祈祷它别犯错。
从会用 AI,到会造 Agent
内容覆盖 Codex CLI、Claude 全家桶、opencode、Claude Agent SDK、LiteLLM、Qdrant、Rerank、RAGAS 等工具链。
它不是单纯罗列工具。
而是把工具放进真实场景里,回答一个更具体的问题:
一个可上线、可评测、可守边界的 Agent 系统,到底应该怎么搭?
适合谁看?
适合开发者。
适合产品经理。
适合行业数字化负责人。
也适合正在把 Agent 从 demo 推向真实业务的团队。
如果你正在做 AI Agent,但卡在工具调用、行业数据、权限控制、成本、评测、红线、上线边界这些问题上,这个仓库值得系统看一遍。
AI Agent 的门槛,正在从“会不会调用模型”,变成“能不能把行业 20 年的流程,拆成工具、Subagent、Hooks 和评测”。
GitHub 地址:
https://github.com/OnelongX/aiagent
公众号:实战复盘
微信号:IamOnelong
夜雨聆风