AI工程

以下是根据我们探讨的内容整理的一篇综合性文章，旨在为开发者提供一个关于AI工程化、结构化输出、状态机架构以及人机协同的实践框架。

---

从 JSON 到状态机：构建可靠 AI 应用的工程化思考

随着大语言模型（LLM）能力的爆发，我们正从“如何调用模型”迈入“如何驾驭模型”的工程化阶段。模型提供了强大的推理与生成上限，但其固有的不确定性也给系统可靠性带来了挑战。本文将结合具体的技术实践，梳理一条从数据交换格式到流程控制架构的清晰路径，探讨如何构建既智能又可靠的 AI 应用。

1. 结构化数据交换：JSON 与 JSONL 的最佳实践

在 LLM 应用中，结构化数据交换是连接非确定性模型与确定性程序逻辑的桥梁。我们通常面临两种场景：

· 单次结构化输出：通过 API 的 JSON Mode 或 Structured Outputs（基于 JSON Schema 约束）强制模型返回合法 JSON。这是实现 Function Calling 和后续逻辑处理的基础。
· 批量与流式数据处理：推荐使用 JSONL（JSON Lines）格式。其特点是每行是一个独立的 JSON 对象，通过换行符 \n 分隔。这种格式极其适合模型微调数据集、批量结果存储以及流式输出的逐条解析。

工程建议：在生产环境中，优先依赖模型原生 API 的 response_format 参数；在后处理环节，引入 jsonschema 等验证库进行数据校验与重试闭环，确保进入业务逻辑的数据是绝对可靠的。

2. 工具链协同：DeepSeek 与 JSONPath 的配合艺术

当我们在代码中集成 DeepSeek 等模型时，需要明确一个边界：模型负责生成，代码负责解析。模型本身并不内置 JSONPath 引擎，但我们可以通过代码在预处理和后处理阶段利用 JSONPath 大幅提升效率。

· 预处理（降本增效）：面对庞大的原始 JSON 数据（如完整的 API 响应），在调用模型前使用 JSONPath（例如 $.data[*].title）提取关键切片，再喂给模型。这能有效减少输入 Token 消耗，并排除噪声干扰，提升回答精度。
· 后处理（精准取数）：当模型返回复杂嵌套结构时，利用 JSONPath 快速提取所需字段（例如 $.analysis.sentiment_score），避免编写繁琐的逐层遍历代码。

这种“数据预处理 -> 模型推理 -> 结构化提取”的模式，是构建稳健 AI 数据管线的标准范式。

3. 评估 LLM 的编码能力：现状、局限与角色定位

将 LLM 视作代码生成器进行评估，我们得出的结论是：它能出色完成短小独立的算法任务，但在复杂工程、安全保障和上下文理解上仍面临巨大挑战。

· 能力现状：在 HumanEval 等基础算法基准上表现优异，但在模拟真实开发环境的 SWE-Bench 中得分依然较低。尤其值得警惕的是代码安全问题，研究表明 AI 生成的代码存在较高比例的高危漏洞。
· 核心局限：包括“包幻觉”（虚构库名）、缺乏自我验证能力以及无法处理跨文件的企业级项目上下文。
· 最佳实践：应将 LLM 定位为高级辅助驾驶（Copilot），而非自动驾驶（Autopilot）。利用其完成样板代码生成、代码解释和单元测试编写，但所有输出必须经过严格的人工审查与自动化测试把关。

4. 语法解析基石：状态机能做什么与不能做什么

理解状态机（FSM）的边界对于设计 AI 流程控制至关重要。

· 能做什么（词法分析范畴）：状态机能完美识别关键字、标识符、数字常量、字符串转义、注释和运算符。这些属于正则文法范畴，无需记忆嵌套深度。
· 不能做什么（语法分析范畴）：状态机无法处理括号匹配、HTML 标签闭合和表达式优先级。这些需要下推自动机（利用栈记忆嵌套层级）来构建抽象语法树（AST）。

结论：在 LLM 应用架构中，状态机适合担任 Token 级别的规则守卫和宏观流程的导航仪，而不适合处理需要深度递归理解的复杂语法逻辑。

5. 流程控制的进化：状态机与“可中断执行”

针对传统同步阻塞代码（如深度嵌套的 if-else 和长耗时 I/O）的短板，状态机提供了一种将“调用栈”摊平为“数据状态”的优雅方案。

· 核心机制：状态机将“程序执行到哪一步了”压缩为一个枚举值（State）。当遇到 I/O 等待时，它不阻塞线程，而是挂起状态并释放线程资源，待事件回调触发时再根据当前状态恢复执行。
· 现代演进：手写状态机虽然解决了并发问题，却带来了“回调地狱”。现代编程语言中的 async/await 语法本质上是一种编译器自动生成的状态机，它在保留同步代码可读性的同时，实现了异步非阻塞的执行效率。

6. 架构融合：状态机 + AI = 可控的智能

“状态机与 AI 结合”是解决 AI 不确定性、实现生产级落地的关键策略。核心思想并非用状态机替代 AI 思考，而是为 AI 搭建一条安全的“轨道”。

架构模式核心逻辑代表框架/工具适用场景
状态机编排 AI Agent 用确定性工作流定义步骤，每一步调用 AI 处理模糊任务 LangGraph, Dapr Workflow 多步骤业务办理、故障排查
AI 内置状态机在 System Prompt 或推理循环中注入状态图，控制对话流转 llm-fsm, Outlines 信息收集机器人、严格合规问答

优势：

1. 消除脆弱性：防止 AI 在长对话中遗忘目标或产生幻觉。
2. 增强可观测性：每一次状态转移都对应明确的业务日志。
3. 提升任务完成率：研究表明，带有状态约束的 AI 在复杂任务上的表现显著优于纯 Prompt 模式。

7. 核心哲学：程序保障下限，AI 提升上限，人在其中选择

这是贯穿所有技术选型背后的第一性原理。在构建 AI 应用时，三者权责的清晰划分是系统成功的关键：

· 程序（确定性逻辑）：负责下限。
· 作用：保障流程不中断、数据不损坏、权限不越界。
· 表现：状态机、JSON Schema 校验、单元测试、熔断限流。
· 类比：自动驾驶汽车的安全气囊和防抱死系统。
· AI（概率性推理）：负责上限。
· 作用：理解模糊指令、处理长尾需求、生成创造性内容。
· 表现：自然语言理解、代码自动补全、复杂内容摘要。
· 类比：自动驾驶汽车的导航路径规划和实时路况识别。
· 人（价值与责任）：负责选择。
· 作用：定义边界、权衡取舍、承担最终的法律与道德责任。
· 表现：采纳或拒绝 AI 建议、处理异常边缘案例、定义系统目标。
· 类比：坐在驾驶座上手握方向盘的司机。

结语

从 JSON 的精确约束，到状态机的流程兜底，再到人机协同的价值判断，构建可靠 AI 应用的过程本质上是一场将软件工程严谨性注入概率模型的实践。只有当我们用确定性的代码为不确定的智能构建好坚实的基座，AI 才能真正从一个有趣的玩具，进化为改变生产关系的生产力工具。