为什么你的 CLI 工具 AI 用不了?5 个维度评估兼容性
2026 年有个有趣的现象:飞书、Google、Stripe、ElevenLabs 等一众公司,不约而同都在发布 CLI 工具。
为什么在图形界面如此发达的今天,这群看起来毫不相关的公司要回去做”命令行”这种复古的东西?
答案很简单:CLI 天然适合 AI 调用。
GUI 是给眼睛看的,AI 没有眼睛。CLI 是纯文字的,AI 天生就在这个世界里运作。
但问题是:不是所有 CLI 都适合 AI 调用。
有些工具装好后 AI 能顺畅使用,有些则会让 AI 频频卡壳。差别在哪?
这篇文章给你一个5 维评估框架,帮你判断一个 CLI 工具对 AI 的友好程度。
🤔 为什么 CLI 对 AI 很重要?
先说结论
CLI 可能是当下效率最高的 AI 能力扩展方式。
想象一下:你有一个非常聪明的新员工,什么都能学,学得快。但它需要两样东西——工具和说明书。
-
装了 ffmpeg,AI 能帮你压缩视频、转格式、截片段 -
装了飞书 CLI,AI 能帮你查日程、发消息、管理文档 -
装了 Google Workspace CLI,AI 能管你的邮箱和云盘
没装?AI 直接说:”不好意思,这个我做不了。”
CLI vs Plugin vs MCP
你可能听过 Plugin、MCP、Skills 这些概念。它们和 CLI 是什么关系?
|
|
|
|
|---|---|---|
| Plugin |
|
|
| MCP |
|
|
| Skills |
|
|
| CLI |
|
|
关键洞察: CLI 把这三样能力打包在一起了,而且不锁平台。
这对国内用户尤其重要——今天用 Claude,明天换 DeepSeek,后天试 Qwen,CLI 不关心调用它的是哪个模型,它是模型无关的执行层。
🧪 5 维 Agent 兼容度评分框架
基于对飞书 CLI、Google Workspace CLI、Stripe CLI 等工具的分析,我总结了一个5 维评估框架:
|
|
|
|
|---|---|---|
| 为 AI 设计 |
|
|
| 结构化输出 |
|
|
| 支持自查 | --help
|
|
| 支持预览 |
--dry-run 预览 |
|
| 上下文友好 |
|
|
评分解读:
-
20 分以上:AI 友好,可以放心让 AI 调用 -
15-20 分:基本可用,但需要人工处理边界情况 -
15 分以下:AI 调用会有较多问题,建议人工介入
📊 维度 1:为 AI 设计(20 分)
核心问题: 这个 CLI 是只给人用的,还是也考虑了 AI 调用?
高分特征(4-5 分)
-
✅ 支持 --no-interactive参数 -
✅ 所有操作通过参数一次性传入,不弹菜单 -
✅ 错误信息包含可操作的建议 -
✅ 认证流程支持非交互模式(如 API Key)
示例:Stripe CLI
stripe listen --forward-to localhost:4242 --no-interactive
低分特征(1-2 分)
-
❌ 交互式菜单(AI 无法选择) -
❌ 必须浏览器登录认证 -
❌ 错误信息模糊(”出错了”但没说怎么修)
示例:飞书 CLI
lark auth login# 弹出浏览器让人工登录,AI 卡住
📊 维度 2:结构化输出(20 分)
核心问题: AI 能不能直接解析输出结果?
高分特征(4-5 分)
-
✅ 支持 --json或--format=json -
✅ JSON 结构稳定、字段命名清晰 -
✅ 支持 field masks 控制返回字段
示例:Google Workspace CLI
gws gmail messages list --fields="messages(id,snippet)"
低分特征(1-2 分)
-
❌ 只有人类可读的彩色文本输出 -
❌ JSON 结构嵌套过深 -
❌ 返回数据冗余(查邮件返回完整 HTML 正文)
📊 维度 3:支持自查(20 分)
核心问题: AI 能不能自己查”这个命令怎么用”?
高分特征(4-5 分)
-
✅ --help信息完整清晰 -
✅ 支持 command --help查子命令 -
✅ 有 capabilities命令返回工具能做什么
示例:Stripe CLI
stripe --helpstripe listen --helpstripe capabilities
低分特征(1-2 分)
-
❌ --help信息缺失或过于简略 -
❌ 子命令没有独立帮助文档 -
❌ 参数说明不清晰
📊 维度 4:支持预览(20 分)
核心问题: AI 执行前能不能先看看会发生什么?
高分特征(4-5 分)
-
✅ 支持 --dry-run预览 -
✅ 有 --confirm参数要求二次确认 -
✅ 危险操作(删除、覆盖)默认不执行
示例:
stripe apps delete --dry-run
低分特征(1-2 分)
-
❌ 命令直接执行,无法预览 -
❌ 删除操作没有确认提示 -
❌ AI 无法判断命令的安全性
📊 维度 5:上下文友好(20 分)
核心问题: 输出会不会撑爆 AI 的上下文窗口?
高分特征(4-5 分)
-
✅ 默认输出简洁 -
✅ 支持 --limit控制返回数量 -
✅ 支持分页( --offset或--page)
示例:Google Workspace CLI
gws gmail messages list --limit 10 --offset 0
低分特征(1-2 分)
-
❌ 默认返回全部数据(几千条) -
❌ 不支持分页 -
❌ 输出包含大量冗余信息
✅ AI 友好 CLI 的设计清单
如果你是 CLI 开发者,想让工具对 AI 更友好,可以参考这个清单:
基础要求(必须满足)
-
非交互模式:支持 --no-interactive或类似参数 -
JSON 输出:支持 --json或--format=json -
完整的 --help:每个命令都有清晰的参数说明 -
合理的默认值:减少用户需要记忆的参数
进阶要求(AI 友好)
-
--dry-run预览:执行前先看会发生什么 -
自描述能力: tool capabilities返回工具能做什么 -
简洁的输出:默认不输出冗余信息 -
清晰的错误码:错误信息包含可操作的建议
加分项
-
Skills 文件:自带 AI 使用说明(Markdown 格式) -
Field masks:允许调用方指定返回字段 -
分页支持:大数据集支持 --limit和--offset
🤖 用户侧:如何让 AI 更好地使用 CLI
如果你是用 CLI 的人,以下技巧能提升 AI 调用成功率:
技巧 1:给 AI 系统信息
你正在 macOS 上操作。当前用户有 sudo 权限。请优先使用 npm 安装工具。
技巧 2:分阶段任务
不要说: “帮我装好飞书 CLI 并能用”
要说:
-
“先查飞书 CLI 的安装方法” -
“执行安装命令,遇到权限错误加 sudo” -
“查认证方法,告诉我需要人工做什么”
技巧 3:人工处理交互环节
AI 卡住时,快速检查:
-
是不是要浏览器登录? -
是不是要输入验证码? -
是不是要确认权限?
这些环节人工处理,处理完把结果告诉 AI 继续。
📌 核心结论
1. CLI 是 AI 能力扩展的关键基础设施
每多装一个好用的 CLI 工具,你的 AI 就多一项技能。
2. 但不是所有 CLI 都”AI 友好”
交互式提示、冗长输出、缺失文档,这些对人来说是小问题,对 AI 来说是大障碍。
3. 用 5 维框架评估工具
安装新 CLI 前,先用评分框架看看它是否适合 AI 调用。
4. 工具开发者需要注意
设计时考虑 AI 调用场景,和事后验证 AI 能否使用,是两回事。参考上面的设计清单,让你的 CLI 更容易被 AI 使用。
🚀 行业还在等什么?
CLI 正在成为 AI 能力扩展的基础设施,但有几个明显缺口等待填补:
1. 发现机制空白
用户怎么知道”有个工具能让 AI 操作飞书”?目前基本靠口口相传,缺少类似 App Store 的发现平台。
2. 认证体验待优化
每个服务一套登录流程,装五个工具登录五次,对普通用户来说摩擦太大。
3. 安装体验需要升级
现有的包管理器是十几年前设计的,假设使用者是懂命令行的开发者。当操作者变成 AI,权限问题、依赖缺失这些”查 Stack Overflow 就能解决”的问题,变成了真正的障碍。
谁先解决这些问题,谁就有可能成为 AI 时代的基础设施提供者。
为什么一夜之间大家都在做 CLI?
歸藏的 AI 工具箱,公众号:歸藏的AI工具箱为什么一夜之间大家都在做 CLI?
往期回顾
-
【实践】Windows 安装 Claude Code 教程(PowerShell 篇) -
【知识】Harness Engineering: AI Agent 核心技能 -
【实践】Claude Code 配置 (CLAUDE.md)
喜欢这篇文章请点赞、在看、分享三连~ 关注公众号获取更多技术干货
夜雨聆风