真懂 AI · 第 03 集 | 系列简介与 5 集全貌请看第 01 集
上集讲了——让 AI 别胡说的关键是让它给出处,再用"3 问"自己验。
这集要拆一件你以为你懂、其实没真懂的事:你天天用的"AI",到底有几种形态?为啥同一个模型在不同地方表现差这么多?

前阵子一个朋友让我帮她审一份服务条款。我没空,但好奇做了个对比实验——把同样的需求拿到三个地方试:
• claude.ai 网页版:把 PDF 拖进去,它读完 + 在 UI 里给一份排版整齐的风险点清单 + 我可以继续追问改写建议。
• 直接调 Claude API(单轮调用):把 PDF + 需求一次性塞进 request 发过去,它回一段答案。一来一回,单轮——除非我自己写代码继续控制它,否则不会继续找相关合同、不会跑对比、不会调任何外部工具。
• Claude Code(agent 工具):让它在本地工作。它自己多步推进——读 PDF → 发现要对照标准模板 → 跑 diff → 又发现要找所有"责任限制"条款 → grep 一遍 → 生成带编号的报告。全程它自己决定下一步。
同一个 Claude,三种结果差别不在模型本身——差的是「能做几步、能不能自己推进、能调用什么工具」。这就是「形态」。
第 02 集讲过——模型只是引擎,外部能力是车身和车轮。这一集就把"车"拆开看——你能用 AI 的几种方式,它们各自能跑多远、给谁开。
三种形态:聊天框 / API / agent 工具
把所有"用 AI 的方式"分类,归根到底就 3 种:

1. 聊天框(客户端)——ChatGPT 网页 / 豆包 App / Kimi / 通义 / claude.ai 客户端
点开就用,对话框里说话,AI 回话。普通用户 99% 的入口。
2. 接口(API)——OpenAI / Anthropic / Google 等模型厂商的开发者接口
程序员往 api.openai.com 或 api.anthropic.com 发请求,拿模型的"裸能力"自己组装。
3. agent 工具——Claude Code / Cursor / Cline / Dify / Coze 等
在 API 之上预装了一整套外部能力(文件读写、终端、网页抓取、MCP)+ 自主循环,能"真把活干完"。
简单类比:
• 聊天框 = 餐厅(菜单固定,进去点菜就行)
• API = 食材直供(去菜市场买原料,自己回家做)
• agent 工具 = 私人厨房 + 厨师(你给一句话,厨师自己完成全套)
三种背后调用的可能是同一个模型——GPT 系列既在 ChatGPT 网页、又在 OpenAI API、还在某些 agent 工具里。形态不同的核心差别在能力组装方式和操作的粒度。
形态一:聊天框(客户端)——现成的套餐
谁在用:所有人,门槛 0。
典型代表:ChatGPT、claude.ai、豆包、Kimi、通义千问、元宝、文心一言、智谱清言。
长处:
• UI 友好,开箱即用,不写代码
• 厂商替你配好了外部能力——联网搜索、文件上传、知识库
• 月费订阅(ChatGPT Plus / Claude Pro 都是 $20/月,国内豆包 Kimi 大多免费),用多少都行(在限额内)
• 自动保存历史、跨设备同步
短处:
• 可调参数极少——温度、top_p、max_tokens 这些大多数客户端不让改
• 速率限制——重度用户经常碰到"接下来 N 小时不能问"的墙
• 没法批量——想让 AI 同时处理 1000 篇文章?做不到
• 不能嵌进自己工作流——只能在聊天框里手动来回粘贴
适合:偶尔用 / 中等频率用 / 不需要批量 / 不写代码的人。99% 的普通用户首选这里就够了。
形态二:API(接口)——模型直供,自己组装
谁在用:开发者、技术团队、想把 AI 嵌进业务流程的人。
典型入口:
• OpenAI Platform: platform.openai.com
• Anthropic Console: console.anthropic.com
• Google AI Studio: aistudio.google.com
长处:
• 参数全开:温度、top_p、max_tokens、stop sequences、stream、tool_use、JSON mode……全能控制
• 按 token 计费:用多少付多少。重度但非每日的用户算下来通常比月费划算(不会因为某天没用就浪费 $20)
• 能批量:写个脚本可以一晚上跑 100 万次调用
• 能嵌进任何工作流:Slack 机器人、CRM 集成、邮件分类、内容审核管道……
• 能接到 agent 工具里——这是形态三的基础
短处:
• 需要会写代码(或用 Postman 这种 GUI 工具发请求)
• 没 UI——所有"用户体验"得自己做
• 联网 / 工具调用要自己配——API 默认不主动联网搜索,要让它去查实时信息得自己挂搜索工具。文件输入 API 直接支持(PDF / 图片传 base64 或 URL),但调外部数据库 / 跑代码 / 改文件,这些要通过 tool_use 自己接
• 基础接口默认无状态——Anthropic Messages、OpenAI chat.completions 这类基础接口,每次请求都要把完整对话历史传过去,长对话 token 成本要自己管。厂商已经在补:OpenAI 的 Responses API 支持 previous_response_id 让服务端管 state,Anthropic 推了 Memory Tool 让 Claude 跨对话读写持久化文件——但这些都得你主动选用
适合:写代码的人 / 想批量自动化 / 想集成到现有系统 / 想用某些客户端没给的模型或参数。
关键认知:很多看起来"很神"的 AI 产品(自动整合数据、监控管道、写代码、回邮件),底层就是有人调了 API + 写了一层 wrapper。模型本身是公开的,差的是包装的工程量。
想试 Claude Opus 4.7 / GPT-5 / Gemini 3 这些主流模型的 API 直连配置,可以在 ofox.io 一站拿到。
形态三:agent 工具——API + 一身装备
谁在用:写代码的人、做研究的人、想让 AI 自动完成"多步任务"的人。
典型代表:
• Claude Code(Anthropic 官方 CLI agent)——改代码、跑命令、读文件、跨项目导航
• Cursor / Windsurf——IDE 里的 AI 编辑器
• Cline / Aider / Roo Code——开源 agent 替代
• Dify / Coze / FastGPT——可视化搭 agent 平台,挂资料挂工具
长处:
• 预装了一身能力:文件读写、终端执行、网页抓取、MCP 工具协议……每个 agent 都有 5-10 个内置工具
• 自主循环:能看自己上一步的结果决定下一步干啥(不像聊天框你得一步一步问)
• 专精某类任务:Cursor 专攻代码、Dify 专攻业务流程、Claude Code 专攻终端 / 项目级编辑
• 底层换模型方便——大多数支持配 base_url 接不同厂商
短处:
• 学习曲线——Claude Code 第一次用得花半天搞懂 commands / skills / agents 几个概念
• 不一定便宜——除了订阅费,每跑一次复杂任务都会调 API 烧 token,重度用算下来一个月几十甚至几百美元
• 锁死特定协议——这是 04 集核心:Claude Code 认 Anthropic 协议、Cursor 灵活但有偏好、有些 agent 锁死单一厂商,想换模型没你想的那么容易
适合:每天要让 AI 干活的人、写代码 / 写报告 / 跑数据分析这种"多步骤任务"的人。
第 02 集说过——agent = 模型 + 工具 + 自主循环。把"工具"具体化,Claude Code 出厂自带 16 个内置工具(截至 2026 年),常用的有:Read / Write / Edit(读写改文件)、Bash(跑命令)、Grep / Glob(搜文件 / 找文件)、WebFetch / WebSearch(抓网页 / 搜索)、Task(派子代理),再加 MCP 协议接任意外部工具——所以它能在你电脑上多步推进、自主决策。
怎么挑?看你要 AI 干什么活
不用记决策清单,按一个原则反推:你想让 AI 帮你完成什么粒度的任务?

• 答一个问题、写一段文字、改一稿、聊一聊 → 聊天框完全够。简单、便宜、不用学。
• 批量处理 100 件相似的事 / 嵌进现有系统 → 你需要 API。或者让懂技术的朋友帮你接。
• 让 AI 端到端完成多步任务(改一整个代码项目、出一份带数据分析的报告、自动审一份合同……)→ 你需要 agent 工具。
很多人有两个误区:
误区 1:以为"AI 越高级越好"——上来就想用 Claude Code。其实 80% 的日常需求,聊天框就行。Claude Code 的学习成本和 token 烧钱是真实的。
误区 2:以为"我不写代码所以不需要 API"——但如果你重度使用 AI(每天 100+ 次问答、要批量处理文章 / 邮件 / 数据),月订阅会撞速率墙,API 反而更省钱也更稳定。可以用 Cherry Studio / 5ire / Chatbox 这类"自带界面的 API 客户端"——填个 base_url 和 key 就能用,不需要写代码。
一句话总结
你以为你在用 GPT-5,其实你在用「GPT-5 + 一身行头」——行头长什么样,决定你能用它干多少活。
• 聊天框 = 套餐:开箱即用,普通人首选
• API = 食材:能力全开 / 按量计费,适合重度或集成场景
• agent 工具 = 私人厨房:把 API 包装成"能自主干活的助手",适合多步骤任务
下集(第 04 集)讲——为什么 Claude Code 装不了 GPT?协议这道墙在哪、能不能绕、绕的代价是什么? 看完你能搞清楚"AI 工具 + 模型"为啥不是随便配的。
下集见。
参考资料
• OpenAI Platform 官方文档 —— API 完整接口与参数文档
• Anthropic API 官方文档 —— Messages API + tool use 规范
• Anthropic《Building Effective Agents》(2024-12-19)—— workflow vs agent 的权威划分
• Anthropic《Writing tools for AI agents》 —— agent 工具设计原则
• Chip Huyen《Building A Generative AI Platform》(2024-07-25)—— 平台层视角看 LLM API 工程
• Chip Huyen《Agents》(2025-01-07)—— RAG 视为 agent 特例的统一视角
• Simon Willison《Things we learned about LLMs in 2024》(2024-12-31)—— API 价格 / 上下文窗口的年度总结
• Hamel Husain《Tokenization Gotchas》 —— 为什么同一 prompt 不同模型计费差很多
• Lilian Weng《LLM Powered Autonomous Agents》(2023-06-23)—— agent 三件套(planning / memory / tool use)
• MCP 官方规范 —— Anthropic 2024-11 推出的标准化工具调用协议
夜雨聆风