乐于分享
好东西不私藏

近期AI实战笔记

近期AI实战笔记

上次(3月21日)跟大家汇报了笔者在养龙虾这件事,笔者创建这个公众号的目的,是希望为广大同道减少一些信息差,好久没有发AI相关内容了,今天不聊科研,我们来聊聊AI。

最近这段时间,AI行业的变化快得有点让人跟不上。但笔者发现,大多数”AI大事件”盘点要么在讲估值融资,要么在比跑分排名,对我们这种普通重度用户来说,真正重要的是另一些事:工具本身发生了什么变化,我们的使用习惯要怎么跟着调整,以及有哪些新功能值得第一时间去试。

所以今天这篇主要聊三件事:近期直接影响使用的行业变化、笔者目前在用的工具清单、以及OpenClaw实战的一些经验分享。


一、最近有哪些跟我们直接相关的变化

1. Claude正式打通Office三件套

这件事之前在文章里提过,不少读者也问进展,说一下最新情况。

Claude for Excel和PowerPoint已经上线一段时间了,今年4月10日,Claude for Word也正式公测——至此,Word、Excel、PowerPoint三件套全部打通。

这个整合的价值不只是”在Office里能用AI”,而是三个插件共享同一个对话上下文。举个实际场景:在Excel里分析完Q1销售数据,切到PowerPoint,Claude可以直接把刚才的分析转成演示文稿;再切到Word,还能继续基于同一份数据写配套报告——全程不需要复制粘贴,也不需要重新解释背景。

Word插件有个细节设计得很到位:每一处编辑建议都以修订模式呈现,跟人工编辑的批注格式完全一样,可以逐条接受或拒绝。这比那种直接覆盖原文的方式要实用得多,尤其适合审稿、改合同、修报告这类场景。

目前Word插件仅限Team和Enterprise订阅(25美元/座/月),Pro用户在排队。笔者还未深度测试,后续单独出体验报告。

2. Harness Engineering:AI编程从”会用”到”用好”的分水岭

这是今年2月在工程圈迅速流传的一个概念,跟OpenClaw的使用方式直接相关,值得单独解释一下。

简单来说:模型本身(比如Claude、Qwen)是”马”,Harness是”缰绳”——包括给AI的规则文件(CLAUDE.md)、工具调用约束、反馈机制、错误修正循环等等。Harness Engineering就是认真设计这套”缰绳系统”的工程实践。

这个概念的核心洞察是:同一个模型,Harness设计好不好,性能差距可以非常大。有研究测试了同一个模型在同一个基准任务上跑两次,只换了Harness的设计,结果从42%跳到了78%——模型没变,变的是它运行的环境。

对OpenClaw用户来说,这个概念很有现实意义。我们在调试skill、写系统提示文件、设计Agent工作流的时候,其实就是在做Harness Engineering。为什么有些人的Agent越跑越稳,有些人的总是出错,差的就是这套系统有没有被认真设计过。笔者在调试推文Agent的过程中深有体会,前期踩的很多坑,本质上都是Harness没设计好,而不是模型能力的问题。这个话题后面会单独写一篇。

3. Anthropic封禁了OpenClaw的订阅额度调用

这件事对OpenClaw用户影响直接,单独说一下。4月4日,Anthropic宣布Claude的Pro/Max订阅额度不再覆盖OpenClaw等第三方工具的调用。换句话说,之前花20美元订阅费”无限”薅Claude的方式,结束了。

现在要在OpenClaw里继续用Claude,只能切到按量计费,或者把任务分流到其他模型(本地Qwen、或者通过API中转站接其他替代)。OpenClaw本身还在正常维护,只是”白嫖时代”正式关闭了。

从使用策略上说,这倒逼我们更认真地考虑任务分流:高质量的生成任务继续用Claude API,轻量任务可以考虑本地模型或低价替代。

4. 千问Qwen3.6-Plus:国产编程模型有了新选项

4月2日,阿里发布Qwen3.6-Plus,上线一天就冲上了OpenRouter(全球最大模型API聚合平台)的日榜榜首,单日调用量破1.4万亿token,打破平台历史纪录。

对普通用户最重要的一点:它的编程能力在评测里超过了参数量两三倍的竞争模型,而且目前OpenRouter上有免费版本可以直接试用。原本用本地部署千问做高敏数据处理的读者,可以测一测在线版。


二、笔者在用的AI工具清单

以下是笔者日常重度使用的各类AI(均为网页版或APP),供有需要的读者参考。

1. Claude(Pro会员,20美元/月)

主要用途:对话练习、数据处理、编程框架设计和纠错、文案生成。

Claude的写作和编程能力目前公认最强,这一点没什么争议。日常工作Sonnet 4.6够用,大型项目或复杂推理首选Opus 4.7。处理完数据可以直接生成可供下载的文件,使用体验很顺滑。

Office三件套插件和Claude Code(自动编程系统,需要一定编程基础)这两块笔者还未深度测试,后续单独出报告。

2. Gemini(Ultra会员,约300元/月)

主要用途:图片生成、深度调研、知识库构建、身体健康管理、对话练习。

Gemini最大的优势在于谷歌的生态:它能查阅邮件、记住笔者的人设和健康状况,自带的NotebookLM是搭建个人知识库的大杀器。偶尔Claude编程卡壳时会切到Gemini,Ultra专属的DeepThink功能(速度稍慢,有下架风险)能直接生成复杂网页和工程代码,质量扎实。

3. ChatGPT

在测试OpenClaw期间,笔者的OpenAI账号毫无征兆被封,此后一生黑。不展开了。

4. Windsurf(Pro会员,20美元/月)

笔者的主力自动编程软件,已经帮忙写了5个OpenClaw的skill和数十个Python脚本,体验很好。缺点只有一个:贵。基础20美元额度根本不够用,已经额外花了上百美元买token。想用自动编程的读者,这笔成本要提前做好心理准备。

5. HeyGen(会员29美元/月)

数字人工具,目前笔者用下来效果最好的。可以生成高度逼真的AI数字人讲解视频,在做产品演示、口播内容、企业宣传等场景里省掉了出镜和剪辑的大量人力。如果有做视频内容的需求,这个是目前市场上体验最好的选项之一,29美元的订阅算是比较合理的定价。

6. 视频生成——Seedance 2.0(信息共享)

字节跳动的视频生成模型,最近刷屏抖音和红果短剧的那些”漫剧”风格短视频,背后大量是用这个模型生成的。笔者目前还未能亲自测试,只是作为一个信息同步给各位——如果你在做短视频或者有视频生成需求,这个方向值得持续关注。

7. 其他工具

Skywork(年费Basic会员,1000元):专用来做PPT,垂直场景够用。

豆包:日常科普问答和英语口语练习,免费好用。

千问(本地部署版):处理高敏数据和图片识别时使用,数据不出本地,安全底线。


三、扩展阅读:目前主流AI工具分类速查

以下是笔者调研整理的2026年各类常用AI工具,供感兴趣的读者参考。没有全部亲测,只是把目前口碑和使用量比较稳定的选项列出来,大家按需取用。

【编程类】从”会写代码”到”全自动写项目”

这一类工具的演进速度很快,现在已经从”代码补全”进化到了”自主完成整个项目”的程度,主要分两条路线:

AI IDE(带界面的智能编辑器):Cursor(20美元/月)是目前用户量最大的,基于VS Code改造,Tab补全体验行业最好,支持8个Agent并行开发,适合习惯图形界面的开发者;Windsurf(15美元/月)功能与Cursor相近但价格低一档,跨会话记忆能力不错,适合长期维护同一个项目;GitHub Copilot(10美元/月)是最便宜的入门选择,插件形式可以装在几乎所有主流编辑器里,不需要换环境。

AI Agent(命令行/终端驱动):Claude Code(按量计费,与Claude账号挂钩)是目前编程Agent能力最强的,直接在终端里运行,能读懂整个代码库、跨文件修改、自动跑测试,架构质量公认最好;Windsurf笔者在用,已经帮忙写了数十个脚本。两者定位不同,很多开发者的选择是”Cursor日常写代码 + Claude Code处理复杂重构”。

一句话建议:编程小白入门选Cursor或Windsurf,有一定基础想要更强自主性的可以试Claude Code。不需要全都订阅,先试一个用顺了再说。

【AI搜索/调研类】让查资料这件事效率翻倍

传统搜索引擎给链接,AI搜索给答案,而且带来源引用,用来调研和核实信息很顺手。

Perplexity(免费/Pro 20美元/月):回答每一段都附来源链接,信息密度高,调研类内容用得最多,国内需要梯子;秘塔AI搜索(免费):国内可以直接用的类Perplexity选项,中文资料覆盖好,不想折腾梯子的首选;Kimi(免费/付费):支持超长上下文,可以把几十份PDF一次性丢进去分析,做文献综述或行业调研报告特别好用。

【图像/视频/数字人类】内容创作的效率革命

这块工具今年迭代最猛,门槛也下降得最快。

图像生成:Gemini自带的Nano Banana Pro(Ultra会员)目前综合效果很好;Midjourney(从10美元/月起)依然是追求图片质量的首选,风格控制最稳定;即梦(国内,字节系)免费额度够日常用。

视频生成:Seedance 2.0是字节的视频生成模型,最近抖音和红果短剧上的大量”漫剧”风格短视频背后用的就是它,笔者未亲测,信息同步;Kling(快手系)在国内也很稳定,效果不错。

数字人:HeyGen(29美元/月)目前效果最好的数字人工具,口型同步和真实感都比同类产品好一个档次,适合做口播视频、产品演示、企业宣传。如果有这类需求,这是目前笔者见过最值得付费的选项。

AI音乐:Suno(10美元/月)和Udio可以用文字描述生成完整歌曲,连歌词、伴奏、人声一起生成,质量超出预期。前阵子那首刷屏的”I’m just a vibe”就是Suno生成的。

【效率/自动化类】少做重复劳动

Notion AI(已集成到Notion工作空间):已经在用Notion的人直接开,不用换平台,文档总结、会议纪要、知识库管理都很顺;扣子(字节,国内可用):搭AI工作流的平台,类似OpenClaw但更面向非技术用户,可以用自然语言搭自动化流程;Zapier(有免费版):连接不同工具之间数据流转的老牌自动化平台,AI化程度也在提高,适合有多个SaaS工具需要联动的场景。

以上工具笔者未全部亲测,定价以各官网最新信息为准,仅供参考。


四、用AI有什么感悟

最大的感触还是这句话:AI已经极大抹平了编程的技术壁垒和信息差。基础的编程问题问AI都能找到答案,Windsurf这类全自动编程软件已经能协助编程小白完成较大型的项目(比如写一个APP,或者做一个交互性很强的网页)。

使用者需要做的,是清晰地向AI传达指令——这背后考验的是产品思维和结构化表达能力,跟技术背景的关系反而没那么大。之前处理一个大型数据表需要一整个下午,现在扔给Claude大概只要半小时到一小时,而且大部分时间都花在输入指令和核对结果上,不再是在做重复劳动。

会不会用AI,已经是人与人之间效率差距越来越大的核心来源。


五、我的OpenClaw实战:三个主力功能

1. 公众号推文全自动发布(1小时→5分钟)

以前写一篇推文:搜信源→查原文→写稿→排版→发布,至少一小时起步。现在通过笔者花了将近一个月、总成本在千元级别调试出来的推文Agent,全流程缩到5分钟。每次生成的token成本大约在5元左右,比人工成本低得多。

2. 碎片信息收集

把看到的新闻链接或者概念直接发给Agent,它会在后台自动解析、打标签并记录,随时供调用。再也不担心”看过就忘”。

3. 接入微信的个人秘书

OpenClaw插入微信后,所有待办事项直接发给它,随时在微信里提醒。基于自然对话的交互,比打开”滴答清单”这类传统app要顺手得多——毕竟微信是一直开着的。

目前这三个是主力功能,新功能还在开发中(比如员工行为管理),有进展再跟大家汇报。


六、最后一个提醒(给国内用户)

对于国内用户,使用OpenClaw等工具最大的门槛在于网络环境和API调用链路。想要稳定调用海外顶级模型,必须通过可靠的API中转站,否则很容易遇到账号被封、调用异常等问题。

笔者自己当初也是付出了惨痛代价——OpenAI账号被封、约200元试错成本、搭进去一整个周末——才摸清这条链路。想要动手实操的朋友,这方面提前做好功课会省很多事。

AI的进化速度不会停下。我们能做的,是尽快把它变成自己手里顺手的工具,而不是旁观者。大家有什么好用的工具或踩坑经验,欢迎评论区交流。