先列出我做了哪些项目:
Real time translation:一款实时翻译软件。无论是开在线国际会议,还是观看外文视频,都可以实时翻译成中文。开源链接:https://github.com/linuxhsj/realtime-translate
Zero token:用上 OpenClaw 之后,最烦人的就是 Token 消耗太快。这个项目可以让 OpenClaw 免费使用各种 AI 大模型,目前在 GitHub 上开源并获得 3600 Star。开源链接:https://github.com/linuxhsj/openclaw-zero-token
Bug report:总结单个 Bug,统计分析项目遗留缺陷。
Cold review:代码审核浏览器插件。
Ai bug search:用 AI 方式检索历史 Bug,为新 Bug 提供解决方案。
Summarizer:浏览器插件,可对打开的网页进行总结,也能与网页内容对话。
Hot search:自定义新闻推送系统,主要关注 AI 领域新闻与国内热点,每天早上 8 点定时推送到我的手机。
AskOnce:只提问一次,即可获取所有大模型的回复,不用在 DeepSeek 问一次、豆包再问一次。开源链接:https://github.com/linuxhsj/askonce
以上所有内容,都是在短短一个月之内完成的,而且全部是利用下班时间。我上班非常忙,每天早上 7:30 到晚上 9 点都在公司。 为什么能在这么短的时间内做出这么多项目?答案就是:OpenClaw 让我不需要 24 小时守在电脑前,我在手机上就可以给它下达命令,并接收执行结果。
我并不是一个喜欢追热点的人。其实在过年前,它就已经刷爆朋友圈了,但我一直没有关注。直到春节期间,我看到卡兹克的推文,里面讲到他用 OpenClaw 做了一套新闻系统,还能用一句话往日历里添加行程。我本身就想持续关注 AI 领域,但每天去各种网站看新闻既麻烦又充斥广告,于是我照着卡兹克的思路,写了一个 HotSearch,也就是上面提到的自定义新闻推送系统。它的原理很简单:让程序爬取你关注的网站新闻,再用 AI 总结汇总后发给你。
这个过程中最有意思的是,我真正搞懂了 OpenClaw 是什么、该怎么配置、该怎么用。第一步就是安装,而很多人都卡在这一步,环境配不好、各种报错。这里我分享一下我的安装方法:我并没有急着安装,而是让豆包去抖音上找 10 个点赞量最高的 OpenClaw 安装视频,总结内容发给我;再让元宝去微信公众号找 10 篇点赞量最高的 OpenClaw 安装文章,总结后发给我。综合这些信息,我大致掌握了安装步骤,以及部署过程中可能遇到的坑。
接着跟着其中一个视频,顺利完成安装。其实安装很简单,只需要一行命令,麻烦的是配置环节,比如大模型配置。 这是我遇到的第一个坑:我最先配置的是千问,但千问需要授权,登录授权就花了 5 分钟。遇到问题怎么解决?还是让豆包去抖音搜视频。我之所以喜欢用抖音,是因为有实操画面,这类动手操作的内容一定要看视频、跟着做,才能少出错。
第二个坑是飞书配置,其他步骤都还好,难点在于长链接配置 —— 用来打通飞书与 OpenClaw。我发现按照网上教程操作,这一步很容易失败,本质原因是本地飞书插件没有安装好。如果本地飞书插件没装好,在飞书管理后台点击长链接怎么都不会成功。当时网上相关教程极少,我折腾了一个小时,一开始还以为是权限问题,其实根本不是。也正是这段折腾,让我彻底理解了它的原理。 配置好飞书之后,我就可以通过手机给电脑上的 OpenClaw 发指令,让它执行任务。如果大家现在配置,会方便很多,网上已经有非常详细的教程。
再说回 HotSearch。它已经能抓取网页热点新闻并完成总结,再加上飞书通道配置完成,就可以每天定时发送到我的手机。这里有个关键:定时任务。这是 OpenClaw 自带功能,但我实测发现早期版本并不好用,定时不准确。于是我改用电脑系统自带的定时功能,非常稳定,基本没出过问题。
做完第一个小项目后,我对 OpenClaw 有了初步了解,甚至有点喜欢上它了。因为我可以在手机上发指令,不用一直坐在电脑前,这一点太重要了,谁会 24 小时守在电脑旁呢?
第三个坑:某天我突然发现,给它发消息没有回复。后来通过豆包等 AI 工具排查,发现是千问免费版存在限流。也正是在这个过程中,我了解到 OpenClaw 最核心的配置文件:openclaw.json。这个文件配置了可调用的大模型、消息通道等,OpenClaw 出问题,80% 的情况都出在这里,修复这个文件基本就能解决。看完这个文件,我顺便翻阅了各类 MD 文档,比如 memory、soul、agent 相关说明,也找到了它的技能文件夹,我的 HotSearch 就放在 skill 文件夹下。
其实我想说,不必纠结那些概念:skill、agent、MCP 等等,都非常抽象,从没接触过的人很难理解。我也没有刻意去学,只做一件事 —— 实践。我想做出什么东西,就直接动手做,不用管它叫什么技能、什么智能体。我只想做一个新闻推送系统,做完之后才发现,原来这就叫 skill。
回过头看,skill 到底是什么?就是告诉 OpenClaw 一套做事规则:它不能联网搜索,就给它装一个联网技能;它不能总结公众号文章,就给它一个读取并总结公众号的技能。而 MCP 本质是一套通信协议,有了它,OpenClaw 可以调用各种外部工具。
做完这个项目后,我想看看其他人是怎么使用OpenClaw这个工具、能做出哪些东西,于是去浏览官网。官网上有很多有趣的实践分享:有人用手机给电脑发消息,用 OpenClaw 做出一款 App;有人接了摄像头,24 小时拍摄风景照,自动筛选优质照片收藏。官网真是一个宝藏网站,不仅有配置方法、原理说明,还有大量实践案例。我最喜欢看这些实操分享,点进去还有 YouTube 演示视频,只不过都是英文的。 也正是这个契机,我做了第二个项目:实时音视频翻译。
推动我动手的,一是官网的大量实践分享给了我信心,二是我本身有强烈痛点:我们集团正大力发力海外,新能源车出海,工作中会接触很多国外客户。开国际会议时,英语还能听懂一点,俄语就完全听不懂了。所以我想做一款音视频实时翻译软件,支持在线会议与 YouTube 视频,实时转成中文。
有想法和痛点就立刻开干。我先让 OpenClaw 在 GitHub 上找相关开源仓库,参考现有源码,实测效果并不理想。后来我换了思路:学习优秀产品,在市面上找一款口碑不错的实时翻译软件,让 AI 分析其原理,再让 AI 帮我实现。就这样,真的做出来了,效果非常好。 做这个项目也让我搞懂了实时翻译的核心原理,其实就两步:第一步音频识别,第二步翻译。音频识别有多种方案,目前效果最好的是云端大模型识别。我在 GitHub 找到的源码也是基于大模型识别,但部署在本地,性能差、延迟高,接近 600 毫秒;改用云端大模型后,延迟只有 40 毫秒,完全刷新我的认知。原本以为音频上传云端再返回会很慢,实测却又快又稳。所以还是那句话:实践出真知,想再多不如直接动手。 OpenClaw 官网地址:https://docs.openclaw.ai/
也是在开发这个项目时,我发现 Token 消耗极快,和很多人一样,我开始研究如何优化上下文、节省 Token。通过官网我了解到,官方社区推荐使用 Discord,很多人在里面分享使用经验、交流问题。从那时起,我下载并注册了 Discord,每天在社区看全球大佬的精彩讨论。某天我在官方论坛看到一份 Token 优化文档:简单任务用 Sonnet,研究场景用 Opus,心跳用 Ollama,优化 MD 文件、减少无关上下文长度。我把这套规则应用到自己的配置中。
再分享一个我的 Token 心得:任务执行一段时间后,我会问 OpenClaw:“你当前的上下文长度是多少?分别由哪些部分组成?” 它会列出占用上下文的内容。如果有些文件与当前任务无关,我就告诉它排除这些无关上下文,这样能节省约 60% 的 Token 占用。
但我并不满足,继续寻找免费大模型方案。后来发现英伟达提供免费大模型调用,支持 DeepSeek、GLM 等,不过注册需要海外手机号,通过号码网站可以解决,但我不建议大家折腾,因为速度偏慢。 有没有更好、更快又免费的方案?有。 我想到:平时在网页上使用豆包、DeepSeek 这些工具,本身就不需要付费,能不能把这个过程程序化?OpenClaw 本身具备操作网页的能力,可以打开浏览器、进入 DeepSeek、输入问题并获取回复。说干就干,我把需求交给 OpenClaw,它帮我实现了。原理很简单,使用 Playwright 模拟人操作网页、发送消息、获取回复;后续优化为直接复用浏览器状态,快速发送并接收回复。我陆续接入了主流大模型:Claude / ChatGPT / Gemini / DeepSeek / 豆包 / Grok / 通义千问 / Manus / Kimi / 小米 MiMo。开源链接:https://github.com/linuxhsj/openclaw-zero-token正是基于 Zero Token 项目,我又做了 AskOnce。以前遇到问题,要在 DeepSeek 问一次,不满意再去豆包问一次。我想:能不能只在 OpenClaw 上问一次,让所有模型同时回复,我再对比择优?于是就有了 AskOnce 项目:https://github.com/linuxhsj/askonce也正是 Zero Token 这个项目,让我在短短两周内,抖音内容获得 50 万浏览量、3 万多次收藏,涨粉 1500(超过 1000 粉就可以直播带货了,很多人叫我博主,哈哈,当然我不带货)。要知道,我的抖音之前是零粉丝。期间也出现了不少商机:很多人找我远程指导安装,还有商家想在我主页投放广告、给我分成。但我既没有帮人安装,也没有接广告,不是不想赚这份钱,而是我确实太忙了。更重要的是,拿人钱财就要替人办事、受人安排。我没有靠 OpenClaw 直接赚钱,但它带给了我更珍贵的东西。 比如有了更多时间。现在很少去网上看新闻,因为我每天收到hostsearch的定制推送。
开年回到公司后,我结合自身工作,用 OpenClaw 做了很多研究:包括 Bug 分析、统计、查询、代码审核、网页总结等。要说心得,核心只有一个字:干。 很多人好奇,我能做出来,是不是提示词有什么特别之处?其实我用的就是 PDCA 循环。每次给它布置任务,我都会让它用 PDCA 循环拆解:先把大任务拆成小任务,每个小任务再拆成步骤执行;每一步要有结果、要自行验证;所有小任务完成后,对整个项目做完整测试,并记录完成情况与遇到的问题;项目结束后再复盘架构原理,写出使用说明。 我们后来很多开源技能都是用这套方法做出来的,比如知名的 Superpowers:先头脑风暴明确需求、形态与性能要求 —— 很多人需求说不明白,Superpowers 可以帮我们梳理清楚;接着制定计划(writing-plans),把大目标拆成小任务;然后执行计划(executing-plans),一步步落地。直达链接:https://github.com/obra/superpowers 最后,我想说一些心里话。用它做了这么多项目,我真切觉得它非常实用,甚至定义了未来的工作方式:人不必守在电脑前,OpenClaw 可以 24 小时在电脑上帮你处理工作,你只需要在手机上下命令、收结果。 春节后回到公司,我在全公司分享了它的使用方法,得到了领导的重视与各类资源支持,现在我用上了最强的 Claude 模型,还和公司的伙伴一起研究如何用 AI 为其他部门提效,各项工作正在稳步推进。研发团队已经用上 Claude 写代码,效率大幅提升。未来一年,我信心满满,希望能帮公司把整体效率再往上提一个台阶。 亲爱的朋友,别再观望了,一起参与进来吧。我是从零开始的,它的创始人也只有两个月的经验。希望它也能给你带来力量。 最后感谢讯飞语音输入法,让我在坐地铁的路上,通过口述完成了这篇文章。
References
[1]: https://github.com/linuxhsj/realtime-translate[2]: https://github.com/linuxhsj/openclaw-zero-token[3]: https://github.com/linuxhsj/askonce[4]: https://docs.openclaw.ai/[5]: https://github.com/linuxhsj/openclaw-zero-token[6]: https://github.com/linuxhsj/askonce[7]: https://github.com/obra/superpowers
夜雨聆风