OpenManus使用教程:从安装到跑通你的第一个通用AI Agent

如果你最近刷到过 Manus，大概率会有一种复杂的感觉：

一边觉得它展示出来的“自动完成任务”很震撼；

一边又会想：

这种东西我能不能自己搭一个？

今天要聊的 OpenManus，就是冲着这个问题来的。

它不是一个单纯的聊天机器人，也不是一个只会调用搜索接口的玩具 Agent。它更像是一个开源版的“通用任务执行框架”：你给它一个目标，它会自己规划步骤、调用工具、执行代码、读写文件、访问网页，然后尽量把任务做完。

截至 2026 年 6 月 30 日我查看 GitHub 时，FoundationAgents/OpenManus 仍然是一个非常值得关注的开源 Agent 项目。它采用 MIT 协议，官方 README 里也给出了比较完整的本地安装和运行方式。

官方介绍里还有一个很有意思的细节：OpenManus 来自 MetaGPT 社区成员，项目最初在 3 小时内完成原型，后来持续迭代。它还延伸出了 OpenManus-RL，专门探索用强化学习优化大语言模型 Agent。

今天这篇文章，我们不讲玄学，也不吹“AI 员工马上替代人类”。

我们就做三件事：

• OpenManus 到底是什么；
• 怎么在本地把它跑起来；
• 它适合做什么，不适合做什么。

一、OpenManus 到底是什么？

一句话解释：

OpenManus 是一个开源的通用 AI Agent 框架。

传统 ChatGPT 式产品更像一个“会回答问题的人”。你问什么，它答什么；你让它写方案，它给你一段文字；你让它写代码，它把代码贴给你。

但 Agent 的目标不是“回答”，而是“完成任务”。

比如你可以让它：

• 帮我调研某个开源项目，并整理成 Markdown；
• 打开网页，提取关键信息；
• 写一段 Python 脚本处理文件；
• 生成一个小工具；
• 分析代码仓库结构；
• 根据目标拆解执行步骤。

这背后最关键的变化是：

大模型不再只是输出文字，而是能在一个运行环境里调用工具。

OpenManus 给模型准备了一套工作台，包括命令行、浏览器、文件系统、Python 执行环境、搜索和工具调用能力。模型负责思考下一步做什么，框架负责把这些动作真正执行起来。

所以你可以把它理解成：

大模型是大脑，OpenManus 是手脚和工作台。

二、它和 Manus、ChatGPT 有什么区别？

很多人第一次看到 OpenManus，会下意识问：

这是不是 Manus 的开源平替？

这个说法有点对，但不完全准确。

Manus 更像一个面向普通用户包装好的云端产品，你打开网页就能用，体验重点是任务完成效果。

OpenManus 更像一个给开发者和折腾党准备的开源框架。它的重点不是“免配置即用”，而是：

• 你可以在本地运行；
• 你可以接自己的模型 API；
• 你可以看清楚它怎么规划和调用工具；
• 你可以改代码、加工具、接入自己的工作流。

如果用一个比喻：

ChatGPT 像一个聪明顾问。

Manus 像一个包装好的 AI 助理产品。

OpenManus 则像一个可拆开的 Agent 实验室。

它的优势是开放、可控、可改。

它的代价也很明显：你需要会一点命令行，需要配置模型密钥，也要能接受开源项目常见的依赖、网络、模型兼容问题。

三、本地安装前，你需要准备什么？

先说环境。

官方推荐使用 Python 3.12，并提供了两条安装路线：

• conda：适合已经熟悉 Anaconda / Miniconda 的用户；
• uv：官方更推荐，速度快，依赖管理也更轻。

如果你是第一次折腾，我建议直接走 uv 路线。

你需要准备：

• Python 3.12；
• Git；
• 一个可用的大模型 API Key；
• 稳定的网络环境；
• 基本命令行操作能力。

模型方面，OpenManus 不是自己训练模型，而是调用外部大模型。你需要在配置文件里填入模型名称、API Key、Base URL、最大 token 等信息。

换句话说：

OpenManus 是车架和驾驶系统，真正的发动机还是你接入的模型。

模型越强，任务规划和执行稳定性通常越好；模型越弱，越容易出现跑偏、工具调用失败、反复重试的问题。

四、安装教程：用 uv 跑起来

第一步，克隆仓库：

git clone https://github.com/FoundationAgents/OpenManus.gitcd OpenManus

第二步，安装 uv。

如果你还没有安装，可以执行：

curl -LsSf https://astral.sh/uv/install.sh | sh

第三步，创建并激活虚拟环境：

uv venv --python 3.12source .venv/bin/activate

如果你是 Windows 用户，激活命令通常是：

.venv\Scripts\activate

第四步，安装依赖：

uv pip install -r requirements.txt

如果你后面要用浏览器能力，还需要安装 Playwright 浏览器依赖：

playwright install

这一步很重要。

很多 Agent 项目看起来“不会浏览网页”，其实不是模型不行，而是本地浏览器运行环境没有装好。

五、配置模型：最容易卡住的一步

安装完成后，需要准备配置文件。

官方仓库里有示例配置，通常可以从 config/config.example.toml 复制一份：

cp config/config.example.toml config/config.toml

然后打开 config/config.toml，填写你的模型信息。

一般你需要关注这些字段：

[llm]model = "你的模型名称"base_url = "你的 API 地址"api_key = "你的 API Key"max_tokens = 4096temperature = 0.0

不同模型服务商的字段可能略有差异，但核心逻辑差不多：

• model：你要调用哪个模型；
• base_url：API 请求发到哪里；
• api_key：你的密钥；
• max_tokens：单次输出上限；
• temperature：随机性，任务执行类 Agent 通常建议低一点。

这里有一个非常现实的建议：

第一次跑通时，先不要追求复杂模型组合，先用一个确定可用的模型把主流程跑起来。

很多新手一上来就想同时配置便宜模型、强模型、视觉模型、浏览器工具，结果报错时根本不知道问题出在哪里。

正确姿势是：

先让 main.py 能正常启动；

再让它完成一个很简单的任务；

最后再慢慢加工具和模型。

六、启动 OpenManus

配置好之后，就可以启动：

python main.py

启动成功后，你会进入一个命令行交互界面。

你可以先给它一个简单任务，比如：

请介绍一下 OpenManus 这个项目，并用三点总结它适合什么场景。

如果模型配置正常，它会开始分析任务，然后输出结果。

接着可以稍微加一点工具型任务：

请帮我在当前目录创建一个 notes.md 文件，写入三条学习 OpenManus 的建议。

这类任务可以测试它是否具备文件写入能力。

如果你想测试网页理解能力，可以让它做：

请访问 OpenManus 的 GitHub 页面，整理项目简介、安装方式和适用人群。

这时候浏览器环境、网络环境、模型工具调用能力都会参与进来。

如果它卡住，不要急着怀疑项目本身。

先检查三件事：

• API Key 是否正确；
• Base URL 是否能访问；
• Playwright 浏览器依赖是否安装完整。

七、OpenManus 还有哪些运行方式？

除了最基础的 python main.py，官方仓库还提供了其他入口。

第一个是 MCP 模式：

python run_mcp.py

MCP 可以理解成一种工具连接协议。它的价值在于，让 Agent 更标准化地连接外部工具和服务。

如果你已经在用 Claude Desktop、Cursor、Codex 或其他支持 MCP 的工具，就会更容易理解它：MCP 的目标是把各种能力封装成模型可以调用的“工具服务器”。

第二个是多智能体实验模式：

python run_flow.py

这个更适合研究和实验，不建议一开始就上。

因为多 Agent 听起来很酷，但复杂度也会明显上升：

• 谁负责规划；
• 谁负责执行；
• 谁负责复核；
• 多个 Agent 之间怎么传递上下文；
• 失败后由谁重试。

如果你刚开始学，先把单 Agent 主流程跑通，比一上来折腾多智能体更重要。

另外，官方还内置了 DataAnalysis Agent。它更偏数据分析和可视化任务，可以通过 config.toml 里的 runflow 配置打开。

但同样建议：先跑通主 Agent，再研究这些扩展能力。

八、OpenManus 适合拿来做什么？

我觉得它最适合三类人。

第一类，是想理解 Agent 工作原理的人。

你可以通过它看到一个任务从输入到执行的大致链路：

用户提出目标；

模型拆解任务；

Agent 选择工具；

工具执行动作；

模型观察结果；

继续下一步，直到完成。

这比单纯看 Agent 概念文章有用得多。

第二类，是想搭建个人自动化工作流的人。

比如：

• 定期抓取网页并整理摘要；
• 分析 GitHub 仓库；
• 处理本地文档；
• 批量生成 Markdown；
• 做简单的数据清洗；
• 把重复命令包装成自然语言任务。

这些任务不一定都需要做成完整 App，用 OpenManus 这样的 Agent 框架反而更轻。

第三类，是想做 Agent 产品原型的人。

如果你正在思考“未来的软件是不是由 Agent 调工具完成”，OpenManus 是一个不错的观察样本。

你可以研究它怎么组织 Agent、怎么配置模型、怎么接工具、怎么处理执行结果。

这比只看闭源产品演示更踏实。

九、但它不适合什么？

OpenManus 很有启发性，但不要把它想成万能按钮。

它暂时不适合三种场景。

第一，不适合完全零基础用户。

如果你没装过 Python、没用过 Git、没配过 API Key，安装过程可能会劝退你。

第二，不适合高稳定生产任务。

Agent 执行链路很长，中间任何一步都可能失败：模型理解错、工具调用错、网页变了、网络断了、权限不够、文件路径不对。

所以它更适合探索、原型和半自动任务，而不是一上来接企业核心流程。

第三，不适合权限过大的敏感环境。

一旦你给 Agent 文件读写、命令执行、网页访问能力，它就不再只是“聊天”。它真的能动你的本地环境。

所以建议：

• 不要把重要密钥硬编码进仓库；
• 不要让它在不了解的目录里随便执行命令；
• 不要把生产数据库权限直接交给实验 Agent；
• 先在隔离目录里测试。

Agent 越强，越要重视边界。

十、第一次上手，我建议你这样练

如果你只是想体验，不要一上来就让它做“帮我完成一个商业计划书并自动发邮件给投资人”这种复杂任务。

建议按这个顺序练：

第一步，让它总结一个项目。

请阅读 OpenManus 项目结构，并告诉我主要目录各自负责什么。

第二步，让它写一个文件。

请在当前目录创建 learning.md，总结今天学到的 5 个 OpenManus 知识点。

第三步，让它读网页。

请访问 OpenManus GitHub 页面，整理安装步骤。

第四步，让它执行一个小脚本。

请写一个 Python 脚本，统计当前目录下 Markdown 文件数量。

第五步，再让它做一个完整小任务。

请调研 OpenManus、AutoGPT、CrewAI 的区别，并整理成表格。

这个过程看起来慢，但它能帮你分清楚：

到底是模型配置问题；

还是浏览器工具问题；

还是文件权限问题；

还是 Agent 本身规划能力不够。

这比一开始就扔一个大任务，然后看它失败，要有效得多。

十一、OpenManus 真正值得学习的地方

我觉得 OpenManus 最大的价值，不只是“开源版 Manus”这个标签。

它真正值得学习的是：

它把 Agent 从一个概念，变成了一个可以拆开观察的工程系统。

以前我们讲 Agent，经常停留在几个词：

规划、记忆、工具调用、多智能体、自动执行。

这些词都对，但太抽象。

OpenManus 这类项目的意义在于，你可以看到这些概念到底如何落到代码里：

• Agent 状态怎么维护；
• 工具列表怎么暴露给模型；
• 模型输出怎么变成真实动作；
• 动作失败后怎么反馈给模型；
• 配置文件怎么管理不同模型；
• 浏览器、终端、文件系统怎么变成工具。

这对学习 AI 应用开发非常重要。

因为未来很多产品的核心竞争力，可能不只是“接了哪个模型”，而是：

你能不能把模型、工具、数据、权限和业务流程组织成一个可靠系统。

这才是 Agent 真正难的地方。

最后

如果你只是想找一个“打开即用”的 AI 助理，OpenManus 可能不是最省心的选择。

但如果你想理解 Agent 到底怎么工作，想把大模型从“聊天框”推进到“能执行任务的工作台”，OpenManus 非常值得花一个下午跑一遍。

它会让你意识到一件事：

大模型应用的下一步，不只是更会聊天。

而是开始真正进入你的工作流。

从回答问题，到调用工具；

从生成文本，到执行任务；

从一个模型，到一套运行系统。

这也是 OpenManus 最有意思的地方。

它不是终点。

它更像一个入口。

一个普通开发者也能亲手拆开、运行、改造 Agent 的入口。

如果你还没玩过，建议从最简单的 python main.py 开始。

别急着让它改变世界。

先让它在你的电脑上，认真完成第一个小任务。

参考资料：

• OpenManus GitHub 仓库：https://github.com/FoundationAgents/OpenManus
• OpenManus 中文 README：https://github.com/FoundationAgents/OpenManus/blob/main/README_zh.md
• MCP 官方介绍：https://modelcontextprotocol.io/