AI 实战 · 避坑指南
你的 AI 助理为什么不够聪明?
不是你用的模型不好,而是这 3 个配置项你没调对。一篇帮你找到问题所在
你是不是也遇到过这种场景:换了最新的 GPT-5.4 模型,AI 助理还是答非所问;装了十几个 Skill,但它就是不知道该用哪个;明明部署在本地,响应速度却慢得让人怀疑人生。
问题很可能不在模型本身,而在三个经常被忽略的配置项上。这三个配置,决定了你的 AI 助理是"能用"还是"好用"。
先看结论:AI 助理的智能程度,取决于模型选择、Temperature 参数和 Prompt 结构的协同。任何一个配错,都会让强大的模型表现得像个"人工智障"。
01
模型选择:不是越新越好
很多人以为模型越大越好、越新越好。其实不对。不同场景需要不同的模型,选错了就是花冤枉钱还效果差。
日常对话和写作:选中小型模型就够了。比如 Qwen3.6-35B 这种尺寸,成本只有大模型的五分之一,但日常使用体验几乎一样。没必要每件事都调用 GPT-5.4。
编程和复杂推理:这时候才需要大模型。GPT-5.4、Claude 4、Qwen3.6-122B 这类在工具调用、多步推理上优势明显。但它们的 Token 成本高,不适合当"默认模型"用。
更实际的做法是分层配置:日常任务用中小模型,复杂任务用大模型,本地任务用量化模型。OpenClaw 支持模型 fallback 链,你可以这样配:
1# openclaw.json 配置示例
2"agents": {
3 "supervisor": {
4 "model": {
5 "primary": "openai/qwen3.6-plus",
6 "fallbacks": ["longcat/LongCat-Flash-Lite"]
7 }
8 }
9}
关键原则:把最贵的模型留给最复杂的任务,其他时候用性价比高的模型。聪明不在于用最强的,而在于用最合适的。
02
Temperature 参数:决定"创造力"还是"准确度"
Temperature(温度)是控制模型输出随机性的参数。这个参数调不对,再好的模型也会表现得像个"疯子"或者"复读机"。
Temperature 低(0.1-0.3):输出更确定、更保守。适合编程、数据处理、事实问答。这时候你希望 AI 每次都给出同样的正确答案,而不是"创意答案"。
Temperature 中(0.5-0.7):平衡模式。适合日常对话、写作辅助、总结归纳。既保持一定准确性,又不会死板。
Temperature 高(0.8-1.0):输出更随机、更有创意。适合头脑风暴、创意写作、文案生成。但代价是可能出现幻觉或跑题。
最常见的错误是:默认使用 0.7-0.9 的 Temperature,然后让 AI 帮你写代码或处理数据。结果就是 AI 经常给出"看起来对但其实不对"的答案。
注意:在 OpenClaw 配置中,你可以为不同的 Agent 设置不同的 Temperature。比如 Coder Agent 用 0.2,Writer Agent 用 0.7。不要一个值管所有场景。
03
Prompt 结构:系统指令决定 AI 的"人格"
这是最容易被忽略、但影响最大的一点。你的 AI 助理"聪不聪明",很大程度上取决于你怎么跟它说话——也就是系统 Prompt 的结构。
一个差的 Prompt 是:"帮我写代码"。这种模糊指令,AI 只能猜你要什么,结果自然不理想。
一个好的 Prompt 应该包含这几个层次:
• 角色定义:你是一个 Python 后端工程师,擅长 FastAPI 和数据库优化
• 任务描述:实现一个用户认证接口,支持 JWT 和 OAuth2
• 约束条件:必须包含错误处理、单元测试、类型注解
• 输出格式:返回完整的 Python 文件,包含注释
OpenClaw 的 Agent 配置文件里,你可以为每个 Agent 定义独立的系统 Prompt。这才是让 AI 助理从"泛泛而谈"变成"专业回答"的关键。
1# 好的系统 Prompt 示例
2角色:Python 后端工程师
3技能:FastAPI, PostgreSQL, Redis
4输出:完整可运行的代码 + 注释
5约束:必须包含错误处理和单元测试
记住:系统 Prompt 是 AI 的"人格设定"。设定越清晰,输出越稳定。不要指望 AI 自己"猜"你要什么,直接告诉它。
04
三者协同:让配置产生 1+1+1>3 的效果
这三个配置项不是独立的,它们必须协同工作。一个常见的配置组合是:
• 编程 Agent:Qwen3.6-35B + Temperature 0.2 + 工程师角色 Prompt
• 写作 Agent:GLM-5 + Temperature 0.7 + 文案专家角色 Prompt
• 数据分析 Agent:GPT-5.4 + Temperature 0.1 + 数据分析师角色 Prompt
• 日常对话 Agent:LongCat-Flash-Lite + Temperature 0.5 + 助手角色 Prompt
这就是 OpenClaw 多 Agent 架构的核心思想:不同的 Agent 用不同的配置,各司其职,最终产出远超单一 Agent。
一句话总结:AI 助理的智能程度 = 合适的模型 + 正确的 Temperature + 清晰的 Prompt 结构。任何一个配错,都会让好模型表现失常。下次觉得 AI 不够聪明,先检查这三个配置。
💬 互动话题
你用的 AI 助理有没有出现过"不够聪明"的情况?
评论区告诉我:你踩过哪些配置坑?你更认同哪种调参方法?
如果你身边也有人正为 AI 助理"不够聪明"发愁,可以转给他,这篇能帮他少走很多弯路。
觉得这篇有帮助?点赞、在看、转发三连支持一下。后续还会继续更新 AI Agent 实战系列、避坑指南和工具评测。
👍 点赞 + 在看 + 转发 是对我最大的支持!
— END —
夜雨聆风