AI 扫盲计划 / 第 02 篇
最近 1 个月,8 个 AI 工具都在变
GLM · Kimi · 元宝 · 豆包 · Gemini · ChatGPT · Claude · DeepSeek
二星讲AI / AI 工具选择入门 / 约 8 分钟读完
第一课,我们把 AI 想成一家餐厅,看懂了 Prompt、Context、Agent、RAG。第二课不急着背更多名词。因为最近 1 个月,AI 工具变化太快:有的开始处理微信聊天记录,有的升级深度研究,有的往 Agent 和办公交付走。真正要学的是:不同任务,到底该打开哪个 AI?

这节课不做工具排行榜,只教你看任务、看资料、看交付。
总览 — 工具都在变成 Agent
先问:资料在哪里?交付物是什么?
过去我们问“哪个 AI 最聪明”。现在更该问:它能接住我的资料吗?能把结果交付出来吗?

看图 资料在哪里,通常决定了先打开哪个工具;交付物是什么,决定了最后交给谁做。
今天先掌握 8 个主工具的最新定位:
01
GLM / 智谱清言
GLM=长程任务工程师

看图 GLM-5.1 的新信号很明确:它在往长程 Agent、代码和办公交付方向走。
如果任务不是问一句答一句,而是要规划、执行、修改、交付,GLM 值得放进候选名单。
是什么
Z.AI 官方 GLM-5.1 文档强调 200K 上下文、128K 最大输出、长程任务、函数调用、MCP 和结构化输出。
适合做
适合 Agentic Coding、前端原型、PPT/Word/PDF/Excel 办公交付、复杂任务拆解。
先记住
不要只拿 GLM 闲聊。给它一个清楚交付物,比如“做一份客户分析报告 + 表格 + PPT 大纲”。
02
Kimi
Kimi=深度研究员

看图 Kimi 现在不只是长文档工具,更像能跑深度研究的资料员。
遇到行业研究、竞品分析、政策资料、长报告,Kimi 的优势是把资料链路跑完整。
是什么
Kimi API 模型列表显示 kimi-k2.6 是当前最新模型,Kimi 深度研究会澄清问题、主动搜索、迭代推理并生成带引用报告。
适合做
适合长资料阅读、深度研究、行业报告、法律法规梳理、多源信息汇总。
先记住
不要把题目写得太宽。先限定时间、地区和来源,比如“2026 年 5 月,中国市场,优先官方报告”。
03
腾讯元宝
腾讯元宝=微信生态助手

看图 元宝最近更像微信生态里的 AI 助手:公众号、视频号、文件、聊天记录都能处理。
如果资料主要在微信里,元宝应该优先打开。它的价值不是模型最强,而是离微信生态最近。
是什么
5 月 13 日,元宝支持总结微信聊天记录;App Store 介绍仍强调公众号、视频号、腾讯文档、微信读书等生态信源。
适合做
适合公众号调研、视频号线索、微信群聊纪要、微信文件和腾讯文档总结。
先记住
涉及客户、同事聊天记录时,先想合规和隐私;不要把敏感信息随手转给 AI。
04
豆包
豆包=国民级入口

看图 豆包的关键词是低门槛和多媒体,但 5 月付费分层也开始清楚出现。
豆包很适合公司员工第一次上手 AI:语音、拍照、搜索、P 图、PPT、视频都在一个入口里。
是什么
豆包 App Store 页面写明基础版免费,并出现标准版、加强版、专业版三档订阅;官方介绍覆盖搜索、P 图、写作、翻译、PPT、视频等。
适合做
适合日常问答、语音输入、图片视频创作、轻量办公、员工入门练习。
先记住
豆包不是抖音后台。抖音趋势先用平台数据查,再让豆包帮你改写成选题、脚本和内容方案。
05
Gemini
Gemini=Google 生态 Agent

看图 Gemini 的新方向不是单点问答,而是 Google 生态里的 Agent 化助手。
如果资料在 YouTube、英文网页、Google Workspace 或海外产品生态里,Gemini 的优先级很高。
是什么
Google 5 月 19 日发布 Gemini 3.5 Flash、Gemini Omni、Daily Brief、Gemini Spark;官方帮助确认 Gemini 可搜索和询问 YouTube 内容。
适合做
适合 YouTube 视频理解、海外资料检索、英文信息整理、Google 生态任务。
先记住
Gemini 很适合查 YouTube,但不能替你操作 YouTube 体验,比如保存播放列表或发表评论。
06
ChatGPT
ChatGPT=通用工作台

看图 ChatGPT 最近的变化,是越来越像办公系统里的通用工作台。
ChatGPT 适合做“从问题到交付”的主入口:资料、表格、写作、调研、代码和工作流都能接上。
是什么
5 月 Release Notes 提到 GPT-5.5 Instant 更新、文件库扩展、Excel 和 Google Sheets 侧边栏,以及 Codex 远程和电脑使用能力。
适合做
适合写方案、做市场调研、处理表格、整理文件库、生成培训材料、自动化工作流。
先记住
ChatGPT 很全能,但越全能越要给边界:资料来源、输出格式、判断标准、哪些内容不能编。
07
Claude
Claude=写作与原型搭档

看图 Claude 仍然很会写,但最新信号显示它也在强化代码、Agent 和企业连接器。
如果你要把内容写清楚、把想法变成原型,Claude 仍然是很值得保留的工具。
是什么
Anthropic 5 月 28 日发布 Claude Opus 4.8,官方称 coding、agentic skills、reasoning 和 knowledge work 有提升;4 月还推出 Claude Design。
适合做
适合长文改写、商业表达、代码辅助、可视化原型、页面设计、企业知识工作。
先记住
Claude 的表达好,但不要让好文笔掩盖事实问题。数字、政策、来源仍要回到原文核对。
08
DeepSeek
DeepSeek=推理对照组

看图 DeepSeek 最近补上识图,并灰度聊天记录搜索,更适合做推理和对照。
DeepSeek 的价值不只是便宜或热门,而是适合作为第二意见:同一个任务,让它和其他工具互相校验。
是什么
5 月初 DeepSeek 大范围开放识图模式;5 月 12 日聊天记录搜索进入灰度测试。
适合做
适合中文问答、逻辑推理、代码解释、图片理解、方案初稿和工具对照测试。
先记住
不要把 DeepSeek 当唯一答案。重要结论最好让 DeepSeek、Kimi、ChatGPT 至少两边互相验证。

看图 资料在哪、交付什么、谁来复核,是公司里选 AI 工具的三条基本线。
最后,新手先记住3 条选择规则。
第一,先找资料入口:微信用元宝,YouTube 用 Gemini,长资料和研究用 Kimi。
第二,再看交付物:办公和表格用 ChatGPT,表达和原型用 Claude,长程 Agent 和交付试 GLM。
第三,重要结论要交叉验证:DeepSeek 做第二意见,最后回到原文、数据和业务常识核对。
下一次打开 AI 前,先问自己:资料在哪?我要交付什么?谁来复核?
事实口径
本文依据 2026 年 5 月公开资料整理。AI 工具变化很快,具体功能、地区、账号权限和价格以实际上手及官方页面为准。
Z.AI GLM-5.1 官方文档:https://docs.z.ai/guides/llm/glm-5.1
Kimi API 模型列表:https://platform.kimi.com/docs/models
Kimi 深度研究介绍:https://www.kimi.com/zh-cn/help/deep-research/deep-research-overview
腾讯元宝支持总结微信聊天记录:https://www.ithome.com/0/949/709.htm
腾讯元宝 App Store:https://apps.apple.com/cn/app/id6480446430
豆包 App Store:https://apps.apple.com/cn/app/id6459478672
Google Gemini I/O 2026 更新:https://blog.google/innovation-and-ai/products/gemini-app/next-evolution-gemini-app/
Gemini YouTube 官方帮助:https://support.google.com/gemini/answer/16622858
ChatGPT Release Notes:https://help.openai.com/en/articles/6825453-chatgpt-versionshinweise
ChatGPT Deep Research 帮助:https://help.openai.com/en/articles/10500283-deep-research-in-chatgpt
Claude Release Notes:https://support.claude.com/en/articles/12138966-release-notes
Claude Artifacts 帮助:https://support.claude.com/en/articles/9487310-what-are-artifacts-and-how-do-i-use-them
DeepSeek 识图模式:https://www.ithome.com/0/948/020.htm
DeepSeek 聊天记录搜索:https://www.ithome.com/0/949/303.htm
夜雨聆风