想了解 AI,不妨先认识一下市面上常见的工具

现在想了解 AI，最容易遇到的问题，就是工具太多了。

DeepSeek、豆包、Kimi、ChatGPT、Claude、Gemini，这些名字还没有完全分清楚，又会看到扣子、Manus、即梦、可灵、TRAE、Cursor。

有人在讲大语言模型，有人在讲智能体，有人在讲 AI 编程。

如果之前没有怎么接触过，很容易看了一圈，还是不知道这些东西分别是干什么的，也不知道自己应该从哪里开始。

所以这篇文章就先做一件事情。

把目前国内外比较常见的 AI 工具简单整理一下，说清楚它们是谁做的，主要能完成什么任务，0 基础有没有必要现在就用。

不需要一次全部学会。

先知道市面上大概有什么，以后再看到这些名字，至少不会完全陌生。

模型和工具不是一回事

这里先把一个很容易混乱的问题说清楚。

GPT、DeepSeek、Gemini、Claude，这些名字有时候指模型。

ChatGPT、豆包、Kimi、扣子、TRAE，这些更多是普通人能够直接打开使用的产品。

模型负责提供能力。

产品负责把这些能力做成聊天软件、图片工具、视频工具、智能体平台或者编程工具。

比如 GPT 是 OpenAI 的模型，ChatGPT 是 OpenAI 面向用户推出的产品。

DeepSeek 既有自己的模型，也有可以直接聊天的软件和网页。

Gemini 既是 Google 的模型体系，也有普通人可以直接使用的 Gemini 应用。

0 基础暂时不用研究模型版本，也不用比较各种跑分。

先看这些工具能帮自己做什么，会更容易理解。

最常见的，还是聊天和资料处理

这一类工具最适合刚开始尝试 AI 的人。

你可以把自己的问题直接发给它，也可以让它整理文字、修改文案、分析文件、拆解计划、查找资料。

国内比较常见的有这些：

• DeepSeek：由深度求索推出。很多人会用它分析问题、整理思路、辅助写作。

• 豆包：字节跳动旗下的 AI 助手。可以聊天、搜索、处理文件，也能尝试图片相关功能。国内使用门槛比较低。

• 千问：阿里旗下的 AI 助手。可以做问答、资料整理、文件阅读和内容创作。

• Kimi：月之暗面推出的 AI 助手。很多人会用它阅读资料、整理长文档、搜索信息。

• 腾讯元宝：腾讯推出的 AI 助手。可以聊天、搜索、分析文件，也适合日常办公场景。

• 文心一言：百度推出的 AI 产品。可以做问答、写作和内容整理。

国外比较常见的有这些：

• ChatGPT：OpenAI 推出的 AI 助手。可以聊天、搜索、分析文件、生成图片，也能完成更复杂的资料研究。

• Claude：Anthropic 推出的 AI 助手。可以处理文字、文件和代码，适合整理比较复杂的内容。

• Gemini：Google 推出的 AI 助手。可以聊天、搜索、分析文件、生成图片和视频，也能配合 Google 自己的一些服务使用。

• Grok：xAI 推出的 AI 助手。可以聊天、搜索、生成图片和处理代码。

• Perplexity：更偏向 AI 搜索。它会围绕问题整理资料，并且给出信息来源。

这类工具看起来很多，但刚开始不用全部注册。

如果只想找一个国内可以直接试的工具，豆包、DeepSeek、千问任选一个都可以。

先拿它处理一件自己真的需要解决的事情。

比如整理一段零散想法，修改一篇文案，或者把一份资料提炼成重点。

用过一次以后，再去比较不同工具的区别，会更容易有感觉。

图片生成和视频生成，又是另外一类工具

AI 不只是能聊天。

如果平时会做公众号、小红书、短视频或者店铺内容，还会接触图片生成和视频生成工具。

国内比较常见的有这些：

• 即梦 AI：字节跳动旗下的创作工具。可以根据文字生成图片，也可以通过文字或者图片生成视频片段。

• 可灵 AI：快手推出的图片和视频创作工具。可以用文字生成视频，也可以让已有图片动起来。

• 海螺 AI：MiniMax 推出的 AI 创作工具。比较常见的用途是文字生成视频、图片生成视频。

国外比较常见的有这些：

• Midjourney：主要用于生成图片，也可以继续修改画面或者根据图片制作视频。

• Adobe Firefly：Adobe 推出的创作工具。可以生成和修改图片，也提供视频相关能力。

• Runway：更偏向 AI 视频创作，可以根据文字、图片和其他素材生成视频。

• Sora：OpenAI 推出的视频生成产品。目前产品入口和开放范围仍会变化，国内用户先知道有这个工具就可以。

• Gemini：除了聊天，也可以直接尝试图片和视频生成。

这一类工具不需要先学很多概念。

比如你想给公众号文章做一张封面，就可以先打开即梦或者豆包，把画面要求写出来。

结果出来以后，再看哪里不满意。

颜色是不是太乱，人物是不是不自然，画面比例是不是不适合公众号，图片里是不是出现了多余文字。

然后继续调整。

这样就已经是在使用 AI 做事情了。

如果想让 AI 持续完成任务，可以了解智能体

聊天工具通常是你提出一个问题，它给你一个回答。

智能体会再往前走一点。

它可以围绕一个任务继续查找资料、处理文件、调用工具，最后把结果整理出来。

国内比较容易接触的工具是扣子。

扣子是字节跳动旗下的 AI 产品。现在既可以直接让它处理写作、资料整理、表格、网页等任务，也可以搭建自己的智能体和工作流程。

另外还有这些常见工具：

• Manus：可以围绕一个目标执行任务，比如查资料、整理文件、制作幻灯片、生成网页。

• Dify：可以搭建自己的 AI 应用、知识库和工作流程。

• n8n：更偏向自动化连接，可以把 AI 和表格、邮箱、网页、数据库等工具串起来。

这一部分的门槛会比聊天助手高一点。

因为你需要先想清楚，自己到底希望 AI 长期帮忙完成哪一件事情。

比如做公众号，可以让 AI 帮忙整理选题、修改文章、处理排版、准备配图、保存草稿。

这里面哪些事情可以交出去，哪些内容必须自己判断，需要慢慢拆开。

刚开始只需要知道，AI 已经不只是陪你聊天。

它也可以逐渐进入实际工作流程。

AI 编程也不只是程序员的事情

再往下，还有 AI 编程工具。

以前不会写代码，很难自己做一个网页或者小工具。

现在可以先把需求说出来，让 AI 帮忙生成一个基础版本，再根据结果继续修改。

比较常见的工具有这些：

• TRAE：字节跳动推出的 AI 编程工具。可以通过对话帮助生成代码、修改项目、制作网页和小工具。

• Cursor：AI 代码编辑器。可以理解已有项目，也可以根据要求修改内容。

• GitHub Copilot：GitHub 推出的 AI 编程助手。可以生成代码、回答问题，也能处理更完整的开发任务。

• Claude Code：Anthropic 推出的 AI 编程工具。可以阅读项目文件、修改内容、运行检查。

• Codex：OpenAI 推出的 AI 编程智能体。可以围绕任务处理文件、运行检查并继续修正问题。

• Replit Agent：更偏向通过描述需求生成网页和简单应用。

0 基础可以接触这些工具，但适合从很小的需求开始。

比如做一个记录选题的页面，做一个简单的资料查询工具，或者把重复操作整理成一个小流程。

先看它能不能完成，再慢慢增加要求。

因为网页和自动化流程涉及文件、账号和数据，结果也需要自己检查。

还有一些工具，可以先知道它们存在

AI 工具不只是上面这些。

比如做音乐，可以了解 Suno。

比如做配音和声音处理，可以了解 ElevenLabs。

比如围绕自己提供的资料做阅读和整理，可以了解 Google 的 NotebookLM。

这些工具都有自己的适用场景。

但如果现在完全是 0 基础，没有必要第一天就全部研究。

你只需要先分清楚：

• 聊天和资料处理，用综合型 AI 助手。

• 生成封面和配图，用图片工具。

• 生成视频素材，用视频工具。

• 想让 AI 持续完成任务，再了解智能体和工作流程。

• 想做网页、小工具和自动化，再接触 AI 编程。

可以先这样做练练手

打开豆包、DeepSeek 或者千问。

把自己最近真实遇到的一个问题发给它。

比如：

示例

我最近想开始了解 AI，但不知道哪些功能适合自己。  我的工作主要是做运营，平时也想尝试写公众号。  请帮我分析三个最值得先尝试的使用场景。  每个场景只给一个今天可以完成的小任务。  如果需要我补充信息，可以继续问我。

然后看它给出的结果。

哪些建议真的适合你？

哪些地方太空，需要继续补充情况？

哪些事情确实可以帮自己省一点时间？

这个过程比先看很多工具介绍更重要。

市面上的 AI 工具还会继续增加，产品功能也会不断变化。

不需要追着每一个新名字跑。

先认识常见工具是做什么的，再选一个离自己最近的事情实际用一次。

后面的内容，再慢慢补。这样就可以初步的去做自己的AI学习了解了