事情是这样的
前两天我在 GitHub 上闲逛,看到一个项目的 star 数让我愣了一下——4.4万星。
你要知道,一个开源项目能破万星就已经算爆款了。4.4万星什么概念?差不多就是把 DeepSeek 和 Claude 的官方 SDK 加一块儿还不够打的水平。
我点进去一看,叫 CowAgent。
底下简介特别嚣张:「基于大模型的超级 AI 助理,能主动思考和任务规划」。
我寻思了一下我没寻思明白——现在开源项目都已经卷到这种程度了吗?
但真正让我决定亲自下手的,是它说的另外一句话:支持微信、飞书、钉钉、企微、QQ、公众号、网页接入。
不是哥们,这是要把所有聊天软件一锅端?
于是我就干了每个程序员都会干的事——clone 下来跑一遍。
然后我发现,这个东西,比我想象的要猛得多。
坦率的讲,我已经很多年没有遇到一个让我「装上就跑,跑完就卧槽」的开源项目了。上一个让我有这种感觉的,还是第一次用 Claude Code 的时候。
今天这篇文章,我就是想带你一起走一遍。从下载、安装、配置,到最后在你的微信里真的跑起来一个会主动思考的 AI 助理。
我保证,你看完会手痒。
它是一个什么东西
先别急着动手,我先用最简单的语言说一下这玩意到底是什么。
CowAgent,原名 chatgpt-on-wechat,是 GitHub 上 @zhayujie 开发的一个开源 Agent 框架。但它跟那些需要你写代码才能用的框架不一样——它更像个「成品」。你装好之后,你的微信、飞书、钉钉里就会多出来一个 AI 助手,它不只会跟你聊天,还会自己思考、自己做任务规划、自己调用工具。
它有几个核心能力我觉得还是挺重要的:
第一,它能主动进行任务规划。你跟它说「帮我整理一下今天的 AI 新闻,然后发给我」,它不会直接回你一句「抱歉我无法访问互联网」,而是会自己拆解这个任务——先搜索、再筛选、再整理、最后推给你。
第二,它有长期记忆。你上周跟它聊过的事,它还能记得。不是那种「我把聊天记录存下来了」的假记忆,是真的能把记忆蒸馏、分类、索引,然后在你需要的时候主动调出来。
第三,它有个技能系统。怎么说呢,就跟 Claude Code 的 Skills 一样,你可以从技能广场一键安装各种能力——图像生成、网页搜索、文件处理,甚至你也可以用对话的方式让它自己创造一个技能。
第四,它支持几乎市面上所有主流模型。DeepSeek、Claude、GPT、Gemini、MiniMax、GLM、Kimi、Qwen、豆包、千帆……你想用哪个就换哪个,API key 一填就行。
说实话,光看这串能力列表,我当时的心态是「吹吧你就」。
然后我装上了。
从零开始的安装指南
好了,现在进入正题。我会一步一步带你把 CowAgent 跑起来。
你需要准备什么
一台电脑,Windows、Mac、Linux 都行。Python 版本需要在 3.7 到 3.13 之间。还有一个大模型的 API Key。
API Key 去哪搞?如果你已经有 DeepSeek、Claude、OpenAI 或者其他任何一个模型厂商的账号,直接用就行。如果没有,我最推荐你去 DeepSeek 官网注册一个,充值 10 块钱够你玩一个月的。DeepSeek V4 Flash 便宜得离谱,效果好得离谱。
第一步:克隆项目
打开你的终端,找一个你喜欢的目录(不建议):
git clone https://github.com/zhayujie/CowAgentcd CowAgent
如果你在国内,GitHub 有时候抽风,可以用 Gitee 镜像:
git clone https://gitee.com/zhayujie/CowAgentcd CowAgent
这一步没什么好说的,有手就行。
第二步:安装依赖
接下来装 Python 依赖(不建议):
pip3 install -r requirements.txt
这个命令会装一堆东西。如果你在国内,建议加上清华镜像源,不然等到天荒地老:
pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
然后还有一些可选的拓展依赖,建议也装上:
pip3 install -r requirements-optional.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
如果中间某个依赖报错了,别慌。打开 requirements 文件,找到那个报错的包名,把它前面那一行注释掉,重新跑一遍就行。大概率不会影响核心功能。
第三步:安装 Cow CLI
这一步强烈建议做:
pip3 install -e .
装完之后,你就可以用 cow 命令来管理整个服务了。启动、停止、更新、看日志,全靠它。
第四步:配置
这是最关键的一步,也是最容易踩坑的一步。
先在项目根目录找到 config-template.json,复制一份叫 config.json:


cp config-template.json config.json
然后用你喜欢的编辑器打开 config.json,填几个关键配置:
第一个,model。Agent 模式下官方推荐 deepseek-v4-flash,便宜且强。你也可以选 claude-sonnet-4-6、MiniMax-M2.7、glm-5.1 等,看你手里有什么 key。
第二个,填 API Key。你选什么模型就填什么 key。比如你用 DeepSeek,就填 deepseek_api_key 那一项。

第三个,channel_type。这是你接入的平台,填 weixin 就是微信,feishu 就是飞书,dingtalk 就是钉钉,web 就是网页端。
第四个,agent。设置为 true。不开这个,它就只是一个普通的聊天机器人,开了才变身超级助理。
其他配置暂时用默认的就行。后面想折腾再慢慢调。
以上的配置除了apikey是空白外,其他均为默认,检查一遍即可
第五步:启动
激动人心的时刻。
cow start
就这么简单。
第一次启动会下载一些必要文件,稍微等一会儿。启动成功后,你会看到控制台里蹦出一行日志,告诉你服务已经跑起来了。
如果出现报错比如图片展示则表明你没有安装第三方库web.py(一个轻量级 Web 框架),需要安装后才行。

有两种解决方案,
其一:降级 Python 版本到 3.10.x
下载 Python 3.10 安装包,安装后用它运行项目。
安装后用
python3.10 -m pip install web.py安装依赖。
其二:
从 GitHub 主分支安装,命令如下:
pip install git+https://github.com/webpy/webpy.git
默认情况下,它会启动一个 Web 控制台,打开浏览器访问本地网址 ,你就能直接在网页里跟你的 AI 助理对话了。

如图,我是网址是http://localhost:9899。

说实话,第一次看到那个页面的时候,我的心情大概就是「就这?」,因为界面很朴素,就是一个聊天框。
但当我打了第一句话之后,事情开始变得不一样了。
接入微信
网页端只是开胃菜,真正的重头戏是微信。
配置接入个人微信非常简单。在 Web 控制台里操作就行,不需要改 config 文件。流程大概是:在控制台里选择微信渠道,然后弹出一个二维码,用你的微信扫码,搞定了。


我当时扫完码的那一刻,看着我的微信里多出了一个联系人——一个会主动思考、能做任务规划、能调工具的 AI 助理,就这么活生生地躺在我的聊天列表里了。
那种感觉怎么说呢,有点魔幻。
我给 CowAgent 发了一条消息:「帮我查一下今天有哪些重要的 AI 新闻,整理一下发给我」。
然后我看到它开始了。

它不是直接回复我,而是在后台开始执行——先用 web search 工具搜索最新的 AI 资讯,然后一条条筛选,最后整理成一段干净利落的总结推给我。
整个过程大概花了不到1分钟。
我当时就愣住了。
不是因为它能搜索——能搜索的 AI 助手多了去了。而是因为它不需要我每一步都告诉它该怎么做,它自己就把任务拆解了、执行了、汇总了。
这种感觉太爽了。
飞书和钉钉也一样
飞书的接入方式稍微正式一点,需要在飞书开放平台创建一个应用,拿到 App ID 和 App Secret,填到配置里就行。文档写得很清楚,跟着做十分钟之内搞定。
钉钉也是类似的逻辑。
比较骚的事是,CowAgent 支持多个渠道同时运行。你在微信里跟它聊,同时在飞书群里它也在服务你的同事,两边互不干扰。
想想就觉得兴奋。
它能干什么
跑起来之后,我开始各种折腾它。
让它写代码。我写了一个需求描述丢过去,它自己打开终端、创建文件、写代码、运行测试、修 bug,一套走完。
让它管理文件。我说「帮我把桌面上所有截图按日期归类到文件夹里」,它自己写了个脚本执行了。
让它定时提醒。配置了一个每天早上九点推一条 AI 早报到我的微信上。现在每天早上起床第一件事就是看这条消息。
让它写文章。当然,没这篇文章写得好
。
说到这个,我特别想提一下它的技能系统。
CowAgent 有一个技能广场(skills.cowagent.ai),里面有一堆别人创建好的技能,你点一下就安装了。比如有个叫「AI 资讯」的技能,装上之后你的助理会自动帮你关注 AI 圈的最新动态。还有个「文档翻译」的技能,丢个 PDF 进去,自动翻译成中文然后发给你。
更重要的是,你可以用对话的方式让它自己创造一个技能。你说「我需要一个能帮我自动回复邮件的能力」,它会引导你把流程定义出来,然后生成一个 Skill 文件,之后就能反复用了。
这尼玛就是真正的数字员工啊。
我的一些真实感受
好了,夸了这么多,咱们来说点真实的。
第一个,Token 消耗确实大。Agent 模式下的 Token 使用量,对比普通对话模式,大概要高出 5 到 10 倍。因为它每次决策都要在后台跑好几轮。所以我建议用 DeepSeek V4 Flash 这种性价比高的模型,别一上来就用最贵的,钱包会痛。
第二个,有时候它会「想太多」。你问一个很简单的问题,它可能会启动一套完整的任务规划流程——分析、拆解、搜索、整理——最后给你一个过度复杂的回答。不过这个问题在设置里可以调,把 agent_max_steps 改小一点就能缓解。
第三个,稳定性还有提升空间。毕竟是开源项目,偶尔会遇到一些小 bug。比如有时候微信连接会断,需要重新扫码。但考虑到它更新频率极高(你去看更新日志,几乎每周一个新版本),这些问题修复得很快。
说实话,这些东西我都能接受。因为在它给你带来的那种「我有超级助理了」的感觉面前,这些小毛病真的不算什么。
最后说两句
我记得去年这个时候,大家还在讨论「AI Agent 到底是不是伪命题」。
一年过去,CowAgent 已经 4.4 万星了。
你想想看,超过四万人——不是随便看看,而是真正去下载、安装、使用——他们选择把一个能自主思考和行动的 AI,放进自己的微信、飞书、钉钉里。
这不止是一个趋势。这是一个时代的信号。
我们正在从「我操作 AI」走向「AI 自己操作自己」的阶段。你说一句话,它理解、它规划、它执行、它汇报。
这种感觉,就好像你第一次用智能手机的时候——原来世界可以这样。
而我今天花了这么长篇幅带你们一步步装好它,就是希望你不是看完就算了。
你去装一下。真的。十分钟的事。
你把它丢进你的微信里,跟它说一句话,看它自己动起来。
然后你就会明白,我刚才说的那些,一点都不夸张。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~

加我,学习&交流
夜雨聆风