
LLM 擅长:开放生成、语义理解、意图识别、多轮对话、创意写作 规则擅长:精确计算、格式校验、权限控制、状态机、路由分发 两者结合:LLM 提取参数 + 规则校验 + LLM 生成回答 + 规则过滤敏感词
精确计算 → 规则引擎 + 数据库查询 + 单元测试 实时决策(< 100ms) 传统 ML(XGBoost / 逻辑回归) 可解释决策 规则引擎 + 决策树 + 审计日志 成熟算法场景 已有算法(BM25 / PageRank / 协同过滤) 高频低成本 缓存 + 规则 + 小模型(DistilBERT / TinyLlama)
Q1:需要 100% 准确率吗?是 → 不用 LLMQ2:延迟预算 < 100ms 吗?是 → 不用 LLMQ3:决策过程需要可解释吗?是 → 不用 LLMQ4:有成熟的传统算法吗?是 → 先用传统算法,评估 LLM 边际收益Q5:日均调用量 > 10000 吗?是 → 先考虑规则或小模型
金钱成本:每次调用都有 token 费用,积少成多。 时间成本:延迟是毫秒到秒级,比传统方案慢 1000 倍。 信任成本:输出不可预测,需要额外的校验和兜底。
夜雨聆风