现在想了解 AI,最容易遇到的问题,就是工具太多了。
DeepSeek、豆包、Kimi、ChatGPT、Claude、Gemini,这些名字还没有完全分清楚,又会看到扣子、Manus、即梦、可灵、TRAE、Cursor。
有人在讲大语言模型,有人在讲智能体,有人在讲 AI 编程。
如果之前没有怎么接触过,很容易看了一圈,还是不知道这些东西分别是干什么的,也不知道自己应该从哪里开始。
所以这篇文章就先做一件事情。
把目前国内外比较常见的 AI 工具简单整理一下,说清楚它们是谁做的,主要能完成什么任务,0 基础有没有必要现在就用。
不需要一次全部学会。
先知道市面上大概有什么,以后再看到这些名字,至少不会完全陌生。
模型和工具不是一回事
这里先把一个很容易混乱的问题说清楚。
GPT、DeepSeek、Gemini、Claude,这些名字有时候指模型。
ChatGPT、豆包、Kimi、扣子、TRAE,这些更多是普通人能够直接打开使用的产品。
模型负责提供能力。
产品负责把这些能力做成聊天软件、图片工具、视频工具、智能体平台或者编程工具。
比如 GPT 是 OpenAI 的模型,ChatGPT 是 OpenAI 面向用户推出的产品。
DeepSeek 既有自己的模型,也有可以直接聊天的软件和网页。
Gemini 既是 Google 的模型体系,也有普通人可以直接使用的 Gemini 应用。
0 基础暂时不用研究模型版本,也不用比较各种跑分。
先看这些工具能帮自己做什么,会更容易理解。
最常见的,还是聊天和资料处理
这一类工具最适合刚开始尝试 AI 的人。
你可以把自己的问题直接发给它,也可以让它整理文字、修改文案、分析文件、拆解计划、查找资料。
国内比较常见的有这些:
• DeepSeek:由深度求索推出。很多人会用它分析问题、整理思路、辅助写作。
• 豆包:字节跳动旗下的 AI 助手。可以聊天、搜索、处理文件,也能尝试图片相关功能。国内使用门槛比较低。
• 千问:阿里旗下的 AI 助手。可以做问答、资料整理、文件阅读和内容创作。
• Kimi:月之暗面推出的 AI 助手。很多人会用它阅读资料、整理长文档、搜索信息。
• 腾讯元宝:腾讯推出的 AI 助手。可以聊天、搜索、分析文件,也适合日常办公场景。
• 文心一言:百度推出的 AI 产品。可以做问答、写作和内容整理。
国外比较常见的有这些:
• ChatGPT:OpenAI 推出的 AI 助手。可以聊天、搜索、分析文件、生成图片,也能完成更复杂的资料研究。
• Claude:Anthropic 推出的 AI 助手。可以处理文字、文件和代码,适合整理比较复杂的内容。
• Gemini:Google 推出的 AI 助手。可以聊天、搜索、分析文件、生成图片和视频,也能配合 Google 自己的一些服务使用。
• Grok:xAI 推出的 AI 助手。可以聊天、搜索、生成图片和处理代码。
• Perplexity:更偏向 AI 搜索。它会围绕问题整理资料,并且给出信息来源。
这类工具看起来很多,但刚开始不用全部注册。
如果只想找一个国内可以直接试的工具,豆包、DeepSeek、千问任选一个都可以。
先拿它处理一件自己真的需要解决的事情。
比如整理一段零散想法,修改一篇文案,或者把一份资料提炼成重点。
用过一次以后,再去比较不同工具的区别,会更容易有感觉。

图片生成和视频生成,又是另外一类工具
AI 不只是能聊天。
如果平时会做公众号、小红书、短视频或者店铺内容,还会接触图片生成和视频生成工具。
国内比较常见的有这些:
• 即梦 AI:字节跳动旗下的创作工具。可以根据文字生成图片,也可以通过文字或者图片生成视频片段。
• 可灵 AI:快手推出的图片和视频创作工具。可以用文字生成视频,也可以让已有图片动起来。
• 海螺 AI:MiniMax 推出的 AI 创作工具。比较常见的用途是文字生成视频、图片生成视频。
国外比较常见的有这些:
• Midjourney:主要用于生成图片,也可以继续修改画面或者根据图片制作视频。
• Adobe Firefly:Adobe 推出的创作工具。可以生成和修改图片,也提供视频相关能力。
• Runway:更偏向 AI 视频创作,可以根据文字、图片和其他素材生成视频。
• Sora:OpenAI 推出的视频生成产品。目前产品入口和开放范围仍会变化,国内用户先知道有这个工具就可以。
• Gemini:除了聊天,也可以直接尝试图片和视频生成。
这一类工具不需要先学很多概念。
比如你想给公众号文章做一张封面,就可以先打开即梦或者豆包,把画面要求写出来。
结果出来以后,再看哪里不满意。
颜色是不是太乱,人物是不是不自然,画面比例是不是不适合公众号,图片里是不是出现了多余文字。
然后继续调整。
这样就已经是在使用 AI 做事情了。
如果想让 AI 持续完成任务,可以了解智能体
聊天工具通常是你提出一个问题,它给你一个回答。
智能体会再往前走一点。
它可以围绕一个任务继续查找资料、处理文件、调用工具,最后把结果整理出来。
国内比较容易接触的工具是扣子。
扣子是字节跳动旗下的 AI 产品。现在既可以直接让它处理写作、资料整理、表格、网页等任务,也可以搭建自己的智能体和工作流程。
另外还有这些常见工具:
• Manus:可以围绕一个目标执行任务,比如查资料、整理文件、制作幻灯片、生成网页。
• Dify:可以搭建自己的 AI 应用、知识库和工作流程。
• n8n:更偏向自动化连接,可以把 AI 和表格、邮箱、网页、数据库等工具串起来。
这一部分的门槛会比聊天助手高一点。
因为你需要先想清楚,自己到底希望 AI 长期帮忙完成哪一件事情。
比如做公众号,可以让 AI 帮忙整理选题、修改文章、处理排版、准备配图、保存草稿。
这里面哪些事情可以交出去,哪些内容必须自己判断,需要慢慢拆开。
刚开始只需要知道,AI 已经不只是陪你聊天。
它也可以逐渐进入实际工作流程。
AI 编程也不只是程序员的事情
再往下,还有 AI 编程工具。
以前不会写代码,很难自己做一个网页或者小工具。
现在可以先把需求说出来,让 AI 帮忙生成一个基础版本,再根据结果继续修改。
比较常见的工具有这些:
• TRAE:字节跳动推出的 AI 编程工具。可以通过对话帮助生成代码、修改项目、制作网页和小工具。
• Cursor:AI 代码编辑器。可以理解已有项目,也可以根据要求修改内容。
• GitHub Copilot:GitHub 推出的 AI 编程助手。可以生成代码、回答问题,也能处理更完整的开发任务。
• Claude Code:Anthropic 推出的 AI 编程工具。可以阅读项目文件、修改内容、运行检查。
• Codex:OpenAI 推出的 AI 编程智能体。可以围绕任务处理文件、运行检查并继续修正问题。
• Replit Agent:更偏向通过描述需求生成网页和简单应用。
0 基础可以接触这些工具,但适合从很小的需求开始。
比如做一个记录选题的页面,做一个简单的资料查询工具,或者把重复操作整理成一个小流程。
先看它能不能完成,再慢慢增加要求。
因为网页和自动化流程涉及文件、账号和数据,结果也需要自己检查。
还有一些工具,可以先知道它们存在
AI 工具不只是上面这些。
比如做音乐,可以了解 Suno。
比如做配音和声音处理,可以了解 ElevenLabs。
比如围绕自己提供的资料做阅读和整理,可以了解 Google 的 NotebookLM。
这些工具都有自己的适用场景。
但如果现在完全是 0 基础,没有必要第一天就全部研究。
你只需要先分清楚:
• 聊天和资料处理,用综合型 AI 助手。
• 生成封面和配图,用图片工具。
• 生成视频素材,用视频工具。
• 想让 AI 持续完成任务,再了解智能体和工作流程。
• 想做网页、小工具和自动化,再接触 AI 编程。

可以先这样做练练手
打开豆包、DeepSeek 或者千问。
把自己最近真实遇到的一个问题发给它。
比如:
示例
我最近想开始了解 AI,但不知道哪些功能适合自己。 我的工作主要是做运营,平时也想尝试写公众号。 请帮我分析三个最值得先尝试的使用场景。 每个场景只给一个今天可以完成的小任务。 如果需要我补充信息,可以继续问我。然后看它给出的结果。
哪些建议真的适合你?
哪些地方太空,需要继续补充情况?
哪些事情确实可以帮自己省一点时间?
这个过程比先看很多工具介绍更重要。
市面上的 AI 工具还会继续增加,产品功能也会不断变化。
不需要追着每一个新名字跑。
先认识常见工具是做什么的,再选一个离自己最近的事情实际用一次。
后面的内容,再慢慢补。这样就可以初步的去做自己的AI学习了解了
夜雨聆风