真懂 AI 第 3 课 | 同一个模型,三种用法—

真懂 AI 第 3 课 | 同一个模型,三种用法——你正在用哪种?

真懂 AI · 第 03 集　｜　系列简介与 5 集全貌请看第 01 集
上集讲了——让 AI 别胡说的关键是让它给出处，再用"3 问"自己验。
这集要拆一件你以为你懂、其实没真懂的事：你天天用的"AI"，到底有几种形态？为啥同一个模型在不同地方表现差这么多？

前阵子一个朋友让我帮她审一份服务条款。我没空，但好奇做了个对比实验——把同样的需求拿到三个地方试：

• claude.ai 网页版：把 PDF 拖进去，它读完 + 在 UI 里给一份排版整齐的风险点清单 + 我可以继续追问改写建议。

• 直接调 Claude API（单轮调用）：把 PDF + 需求一次性塞进 request 发过去，它回一段答案。一来一回，单轮——除非我自己写代码继续控制它，否则不会继续找相关合同、不会跑对比、不会调任何外部工具。

• Claude Code（agent 工具）：让它在本地工作。它自己多步推进——读 PDF → 发现要对照标准模板 → 跑 diff → 又发现要找所有"责任限制"条款 → grep 一遍 → 生成带编号的报告。全程它自己决定下一步。

同一个 Claude，三种结果差别不在模型本身——差的是「能做几步、能不能自己推进、能调用什么工具」。这就是「形态」。

第 02 集讲过——模型只是引擎，外部能力是车身和车轮。这一集就把"车"拆开看——你能用 AI 的几种方式，它们各自能跑多远、给谁开。

三种形态：聊天框 / API / agent 工具

把所有"用 AI 的方式"分类，归根到底就 3 种：

1. 聊天框（客户端）——ChatGPT 网页 / 豆包 App / Kimi / 通义 / claude.ai 客户端

点开就用，对话框里说话，AI 回话。普通用户 99% 的入口。

2. 接口（API）——OpenAI / Anthropic / Google 等模型厂商的开发者接口

程序员往 api.openai.com 或 api.anthropic.com 发请求，拿模型的"裸能力"自己组装。

3. agent 工具——Claude Code / Cursor / Cline / Dify / Coze 等

在 API 之上预装了一整套外部能力（文件读写、终端、网页抓取、MCP）+ 自主循环，能"真把活干完"。

简单类比：

• 聊天框 = 餐厅（菜单固定，进去点菜就行）

• API = 食材直供（去菜市场买原料，自己回家做）

• agent 工具 = 私人厨房 + 厨师（你给一句话，厨师自己完成全套）

三种背后调用的可能是同一个模型——GPT 系列既在 ChatGPT 网页、又在 OpenAI API、还在某些 agent 工具里。形态不同的核心差别在能力组装方式和操作的粒度。

形态一：聊天框（客户端）——现成的套餐

谁在用：所有人，门槛 0。

典型代表：ChatGPT、claude.ai、豆包、Kimi、通义千问、元宝、文心一言、智谱清言。

长处：

• UI 友好，开箱即用，不写代码

• 厂商替你配好了外部能力——联网搜索、文件上传、知识库

• 月费订阅（ChatGPT Plus / Claude Pro 都是 $20/月，国内豆包 Kimi 大多免费），用多少都行（在限额内）

• 自动保存历史、跨设备同步

短处：

• 可调参数极少——温度、top_p、max_tokens 这些大多数客户端不让改

• 速率限制——重度用户经常碰到"接下来 N 小时不能问"的墙

• 没法批量——想让 AI 同时处理 1000 篇文章？做不到

• 不能嵌进自己工作流——只能在聊天框里手动来回粘贴

适合：偶尔用 / 中等频率用 / 不需要批量 / 不写代码的人。99% 的普通用户首选这里就够了。

形态二：API（接口）——模型直供，自己组装

谁在用：开发者、技术团队、想把 AI 嵌进业务流程的人。

典型入口：

• OpenAI Platform: platform.openai.com

• Anthropic Console: console.anthropic.com

• Google AI Studio: aistudio.google.com

长处：

• 参数全开：温度、top_p、max_tokens、stop sequences、stream、tool_use、JSON mode……全能控制

• 按 token 计费：用多少付多少。重度但非每日的用户算下来通常比月费划算（不会因为某天没用就浪费 $20）

• 能批量：写个脚本可以一晚上跑 100 万次调用

• 能嵌进任何工作流：Slack 机器人、CRM 集成、邮件分类、内容审核管道……

• 能接到 agent 工具里——这是形态三的基础

短处：

• 需要会写代码（或用 Postman 这种 GUI 工具发请求）

• 没 UI——所有"用户体验"得自己做

• 联网 / 工具调用要自己配——API 默认不主动联网搜索，要让它去查实时信息得自己挂搜索工具。文件输入 API 直接支持（PDF / 图片传 base64 或 URL），但调外部数据库 / 跑代码 / 改文件，这些要通过 tool_use 自己接

• 基础接口默认无状态——Anthropic Messages、OpenAI chat.completions 这类基础接口，每次请求都要把完整对话历史传过去，长对话 token 成本要自己管。厂商已经在补：OpenAI 的 Responses API 支持 previous_response_id 让服务端管 state，Anthropic 推了 Memory Tool 让 Claude 跨对话读写持久化文件——但这些都得你主动选用

适合：写代码的人 / 想批量自动化 / 想集成到现有系统 / 想用某些客户端没给的模型或参数。

关键认知：很多看起来"很神"的 AI 产品（自动整合数据、监控管道、写代码、回邮件），底层就是有人调了 API + 写了一层 wrapper。模型本身是公开的，差的是包装的工程量。

想试 Claude Opus 4.7 / GPT-5 / Gemini 3 这些主流模型的 API 直连配置，可以在 ofox.io 一站拿到。

形态三：agent 工具——API + 一身装备

谁在用：写代码的人、做研究的人、想让 AI 自动完成"多步任务"的人。

典型代表：

• Claude Code（Anthropic 官方 CLI agent）——改代码、跑命令、读文件、跨项目导航

• Cursor / Windsurf——IDE 里的 AI 编辑器

• Cline / Aider / Roo Code——开源 agent 替代

• Dify / Coze / FastGPT——可视化搭 agent 平台，挂资料挂工具

长处：

• 预装了一身能力：文件读写、终端执行、网页抓取、MCP 工具协议……每个 agent 都有 5-10 个内置工具

• 自主循环：能看自己上一步的结果决定下一步干啥（不像聊天框你得一步一步问）

• 专精某类任务：Cursor 专攻代码、Dify 专攻业务流程、Claude Code 专攻终端 / 项目级编辑

• 底层换模型方便——大多数支持配 base_url 接不同厂商

短处：

• 学习曲线——Claude Code 第一次用得花半天搞懂 commands / skills / agents 几个概念

• 不一定便宜——除了订阅费，每跑一次复杂任务都会调 API 烧 token，重度用算下来一个月几十甚至几百美元

• 锁死特定协议——这是 04 集核心：Claude Code 认 Anthropic 协议、Cursor 灵活但有偏好、有些 agent 锁死单一厂商，想换模型没你想的那么容易

适合：每天要让 AI 干活的人、写代码 / 写报告 / 跑数据分析这种"多步骤任务"的人。

第 02 集说过——agent = 模型 + 工具 + 自主循环。把"工具"具体化，Claude Code 出厂自带 16 个内置工具（截至 2026 年），常用的有：Read / Write / Edit（读写改文件）、Bash（跑命令）、Grep / Glob（搜文件 / 找文件）、WebFetch / WebSearch（抓网页 / 搜索）、Task（派子代理），再加 MCP 协议接任意外部工具——所以它能在你电脑上多步推进、自主决策。

怎么挑？看你要 AI 干什么活

不用记决策清单，按一个原则反推：你想让 AI 帮你完成什么粒度的任务？

• 答一个问题、写一段文字、改一稿、聊一聊 → 聊天框完全够。简单、便宜、不用学。

• 批量处理 100 件相似的事 / 嵌进现有系统 → 你需要 API。或者让懂技术的朋友帮你接。

• 让 AI 端到端完成多步任务（改一整个代码项目、出一份带数据分析的报告、自动审一份合同……）→ 你需要 agent 工具。

很多人有两个误区：

误区 1：以为"AI 越高级越好"——上来就想用 Claude Code。其实 80% 的日常需求，聊天框就行。Claude Code 的学习成本和 token 烧钱是真实的。

误区 2：以为"我不写代码所以不需要 API"——但如果你重度使用 AI（每天 100+ 次问答、要批量处理文章 / 邮件 / 数据），月订阅会撞速率墙，API 反而更省钱也更稳定。可以用 Cherry Studio / 5ire / Chatbox 这类"自带界面的 API 客户端"——填个 base_url 和 key 就能用，不需要写代码。

一句话总结

你以为你在用 GPT-5，其实你在用「GPT-5 + 一身行头」——行头长什么样，决定你能用它干多少活。

• 聊天框 = 套餐：开箱即用，普通人首选

• API = 食材：能力全开 / 按量计费，适合重度或集成场景

• agent 工具 = 私人厨房：把 API 包装成"能自主干活的助手"，适合多步骤任务

下集（第 04 集）讲——为什么 Claude Code 装不了 GPT？协议这道墙在哪、能不能绕、绕的代价是什么？ 看完你能搞清楚"AI 工具 + 模型"为啥不是随便配的。

下集见。

参考资料

• OpenAI Platform 官方文档 —— API 完整接口与参数文档

• Anthropic API 官方文档 —— Messages API + tool use 规范

• Anthropic《Building Effective Agents》（2024-12-19）—— workflow vs agent 的权威划分

• Anthropic《Writing tools for AI agents》 —— agent 工具设计原则

• Chip Huyen《Building A Generative AI Platform》（2024-07-25）—— 平台层视角看 LLM API 工程

• Chip Huyen《Agents》（2025-01-07）—— RAG 视为 agent 特例的统一视角

• Simon Willison《Things we learned about LLMs in 2024》（2024-12-31）—— API 价格 / 上下文窗口的年度总结

• Hamel Husain《Tokenization Gotchas》 —— 为什么同一 prompt 不同模型计费差很多

• Lilian Weng《LLM Powered Autonomous Agents》（2023-06-23）—— agent 三件套（planning / memory / tool use）

• MCP 官方规范 —— Anthropic 2024-11 推出的标准化工具调用协议