去年有一阵子,我在一个程序员群里看到有人问了一个问题,大概意思是:
"有没有一个AI,不光能聊天,还能真的帮我干点活?"
下面跟了一堆回答。有人说用ChatGPT,有人说用Coze,有人说用海外的一个什么工具。但仔细看下来,要么要付费,要么是国外的网络连不上,要么功能太复杂根本不知道怎么配。
这个问题其实一直盘旋在我脑子里。因为我自己的需求也挺明确的:
市面上不是没有这类工具。但要么太贵,要么数据不在自己手里,要么配置起来太折腾。
后来我想,既然我是干这行的,为什么不做呢?
断断续续搞了半年。GuaDa AI 终于跑起来了。今天聊聊这个东西,不讲代码,不讲架构,就聊聊它能做什么、怎么用、为什么值得你试试。
它不仅仅是一个"会聊天的AI"
你可能用过一些AI对话工具。你问一句,它回一句。看起来挺智能,但用几天就发现——好像也就那样。
GuaDa AI不一样的地方在于,它不光会聊天,它还能连接你的东西,帮你干实际的事情。
我举几个例子。
第一个场景:你有一堆技术文档。
你可能跟我是同行,电脑里攒了不少PDF、Word、技术手册。有时候想找一个配置项,翻半天找不到。你把这堆文档丢给GuaDa AI,它能把内容"读"进去。你再问它"这个配置怎么改"、"那个参数是什么意思",它翻翻文档就能告诉你答案,不用你再去一页一页翻。
它不是靠搜索引擎去找答案,而是真的把你给的资料读明白了再回答。
第二个场景:你需要一个定时跑的任务。
比如你每天早晨想看天气再出门。你跟GuaDa AI说一句"每天早上8点帮我查一下今天的天气,推给我",它就记住了。到点了,它自动去查,查完再发给你。
你也可以让它去查股票行情、监控某个网站有没有更新、提醒你几点开会。只要它能调用的工具,它都能帮你跑起来。
第三个场景:你在群里聊天,突然需要查点东西。
你在QQ群里跟同事聊着聊着,突然需要查一个技术参数。不用切窗口打开网页搜索再复制回来,直接在群里@GuaDa AI,告诉它你要查什么。它查完了,把答案发回群里。
整个体验就像群里多了一个程序员朋友,什么问题随手@它就行。
它的能力可以自己"安装"
我有一个奇怪的比喻来解释它的设计思路——我觉得它像一个刚装好系统的手机。
手机刚买回来的时候,只有基础功能:打电话、发短信、上网。但它不够"好用",因为你想要的很多功能它都没有。你得自己去应用商店下载App。
GuaDa AI也是一样的逻辑。
刚搭好的时候,它能做的事情就是基础的对话、回答问题。但随着你给它装上不同的"技能",它的能力会越来越强。
比如你给它装一个"知识库读取"的技能,它就能读懂你上传的文档。
比如你给它装一个"工具调用"的技能,它就能帮你查天气、查时间、调接口。
比如你给它装一个"联网搜索"的技能,它就能去网上帮你找答案。
更关键的是,这些技能是可以随时开关的。你不需要的技能就先关掉,这样它回答问题的时候就不会被干扰。等到要用的时候再打开。就像手机的App一样方便。
如果你会写一点代码,还可以自己给它写一个新技能。想让它做什么,你说了算。
它能接上你常用的聊天工具
说实话,我个人很不喜欢每次跟AI聊天还要专门打开一个网页。来回切窗口,效率反而更低了。
所以GuaDa AI做了一个很重要的设计:它能接入你日常使用的聊天工具。
目前支持QQ、飞书、企业微信。以后还会接入更多的平台。
什么意思呢?
就是你在QQ群里@它,或者在飞书上给它发一条消息,它就能响应。你说"帮我查一下明天的天气",它就去查了,然后把结果发回群里。
你不用切换到任何网页,不用打开任何额外的App。就在你平时聊天的界面里,多了一个随时能叫的帮手。
我自己的用法是这样的:我在QQ上建了一个只有我和它的群聊。想到什么问题,直接丢进去。它看到了就回答。一些需要定时做的事情,也在这个群里处理。每天早上我到工位打开手机,就能看到它已经把今天的天气和日程发在群里了。
很像有一个助理在默默帮你打理事情。
做这个项目最让我上头的瞬间
说实话,做了半年,最让我激动的不是技术难题攻克,而是第一次看到它真正帮我省了时间。
有一次我在做一个项目,需要查一个第三方服务的API文档。那文档两百多页,我之前看了两天都没完全记住。后来我把文档丢给GuaDa AI,问了一句"这个参数什么意思"。它翻了大概几秒钟,给我回了准确的内容。
那一刻的感觉很奇怪。我做的这个东西,真的在帮我干活了。
它不是那种"给你讲个笑话"、"陪你聊聊天"的玩具AI。它是真的能减轻你工作负担的一个工具。
顺手开源了
做都做了,放着也是放着,不如开源出来,给有需要的人用。
代码我已经放到Gitee上了,MIT协议。什么叫MIT协议?就是你随便下载、随便改、随便用,不管你是个人还是公司,都没有限制。
地址:gitee.com/zhendongdong/guada_ai
你如果也想要一个自己专属的AI助手,可以直接拿来用。如果你会一点编程,还可以在上面做二次开发,给它加你想要的功能。
如果你不会编程也没关系,我已经把基本的技能和配置都做好了,按照文档配置一下就能跑起来。
后面还会聊什么
这个项目做下来,积累了不少经验和踩坑记录。后面我会继续写几篇,把里面一些好玩的模块拆开聊一聊。
比如怎么给AI装"技能"——你不需要会写代码也能理解这个概念;比如怎么把AI接进QQ群——会的人觉得简单,不会的人觉得神奇,我想把这个差距填上;比如怎么让AI去读你的文档——你丢一堆文件进去,它真的能读懂。
你想了解哪一块,也可以直接告诉我。我挑大家感兴趣的来写。
夜雨聆风