近期AI实战笔记

上次（3月21日）跟大家汇报了笔者在养龙虾这件事，笔者创建这个公众号的目的，是希望为广大同道减少一些信息差，好久没有发AI相关内容了，今天不聊科研，我们来聊聊AI。

最近这段时间，AI行业的变化快得有点让人跟不上。但笔者发现，大多数”AI大事件”盘点要么在讲估值融资，要么在比跑分排名，对我们这种普通重度用户来说，真正重要的是另一些事：工具本身发生了什么变化，我们的使用习惯要怎么跟着调整，以及有哪些新功能值得第一时间去试。

所以今天这篇主要聊三件事：近期直接影响使用的行业变化、笔者目前在用的工具清单、以及OpenClaw实战的一些经验分享。

一、最近有哪些跟我们直接相关的变化

1. Claude正式打通Office三件套

这件事之前在文章里提过，不少读者也问进展，说一下最新情况。

Claude for Excel和PowerPoint已经上线一段时间了，今年4月10日，Claude for Word也正式公测——至此，Word、Excel、PowerPoint三件套全部打通。

这个整合的价值不只是”在Office里能用AI”，而是三个插件共享同一个对话上下文。举个实际场景：在Excel里分析完Q1销售数据，切到PowerPoint，Claude可以直接把刚才的分析转成演示文稿；再切到Word，还能继续基于同一份数据写配套报告——全程不需要复制粘贴，也不需要重新解释背景。

Word插件有个细节设计得很到位：每一处编辑建议都以修订模式呈现，跟人工编辑的批注格式完全一样，可以逐条接受或拒绝。这比那种直接覆盖原文的方式要实用得多，尤其适合审稿、改合同、修报告这类场景。

目前Word插件仅限Team和Enterprise订阅（25美元/座/月），Pro用户在排队。笔者还未深度测试，后续单独出体验报告。

2. Harness Engineering：AI编程从”会用”到”用好”的分水岭

这是今年2月在工程圈迅速流传的一个概念，跟OpenClaw的使用方式直接相关，值得单独解释一下。

简单来说：模型本身（比如Claude、Qwen）是”马”，Harness是”缰绳”——包括给AI的规则文件（CLAUDE.md）、工具调用约束、反馈机制、错误修正循环等等。Harness Engineering就是认真设计这套”缰绳系统”的工程实践。

这个概念的核心洞察是：同一个模型，Harness设计好不好，性能差距可以非常大。有研究测试了同一个模型在同一个基准任务上跑两次，只换了Harness的设计，结果从42%跳到了78%——模型没变，变的是它运行的环境。

对OpenClaw用户来说，这个概念很有现实意义。我们在调试skill、写系统提示文件、设计Agent工作流的时候，其实就是在做Harness Engineering。为什么有些人的Agent越跑越稳，有些人的总是出错，差的就是这套系统有没有被认真设计过。笔者在调试推文Agent的过程中深有体会，前期踩的很多坑，本质上都是Harness没设计好，而不是模型能力的问题。这个话题后面会单独写一篇。

3. Anthropic封禁了OpenClaw的订阅额度调用

这件事对OpenClaw用户影响直接，单独说一下。4月4日，Anthropic宣布Claude的Pro/Max订阅额度不再覆盖OpenClaw等第三方工具的调用。换句话说，之前花20美元订阅费”无限”薅Claude的方式，结束了。

现在要在OpenClaw里继续用Claude，只能切到按量计费，或者把任务分流到其他模型（本地Qwen、或者通过API中转站接其他替代）。OpenClaw本身还在正常维护，只是”白嫖时代”正式关闭了。

从使用策略上说，这倒逼我们更认真地考虑任务分流：高质量的生成任务继续用Claude API，轻量任务可以考虑本地模型或低价替代。

4. 千问Qwen3.6-Plus：国产编程模型有了新选项

4月2日，阿里发布Qwen3.6-Plus，上线一天就冲上了OpenRouter（全球最大模型API聚合平台）的日榜榜首，单日调用量破1.4万亿token，打破平台历史纪录。

对普通用户最重要的一点：它的编程能力在评测里超过了参数量两三倍的竞争模型，而且目前OpenRouter上有免费版本可以直接试用。原本用本地部署千问做高敏数据处理的读者，可以测一测在线版。

二、笔者在用的AI工具清单

以下是笔者日常重度使用的各类AI（均为网页版或APP），供有需要的读者参考。

1. Claude（Pro会员，20美元/月）

主要用途：对话练习、数据处理、编程框架设计和纠错、文案生成。

Claude的写作和编程能力目前公认最强，这一点没什么争议。日常工作Sonnet 4.6够用，大型项目或复杂推理首选Opus 4.7。处理完数据可以直接生成可供下载的文件，使用体验很顺滑。

Office三件套插件和Claude Code（自动编程系统，需要一定编程基础）这两块笔者还未深度测试，后续单独出报告。

2. Gemini（Ultra会员，约300元/月）

主要用途：图片生成、深度调研、知识库构建、身体健康管理、对话练习。

Gemini最大的优势在于谷歌的生态：它能查阅邮件、记住笔者的人设和健康状况，自带的NotebookLM是搭建个人知识库的大杀器。偶尔Claude编程卡壳时会切到Gemini，Ultra专属的DeepThink功能（速度稍慢，有下架风险）能直接生成复杂网页和工程代码，质量扎实。

3. ChatGPT

在测试OpenClaw期间，笔者的OpenAI账号毫无征兆被封，此后一生黑。不展开了。

4. Windsurf（Pro会员，20美元/月）

笔者的主力自动编程软件，已经帮忙写了5个OpenClaw的skill和数十个Python脚本，体验很好。缺点只有一个：贵。基础20美元额度根本不够用，已经额外花了上百美元买token。想用自动编程的读者，这笔成本要提前做好心理准备。

5. HeyGen（会员29美元/月）

数字人工具，目前笔者用下来效果最好的。可以生成高度逼真的AI数字人讲解视频，在做产品演示、口播内容、企业宣传等场景里省掉了出镜和剪辑的大量人力。如果有做视频内容的需求，这个是目前市场上体验最好的选项之一，29美元的订阅算是比较合理的定价。

6. 视频生成——Seedance 2.0（信息共享）

字节跳动的视频生成模型，最近刷屏抖音和红果短剧的那些”漫剧”风格短视频，背后大量是用这个模型生成的。笔者目前还未能亲自测试，只是作为一个信息同步给各位——如果你在做短视频或者有视频生成需求，这个方向值得持续关注。

7. 其他工具

Skywork（年费Basic会员，1000元）：专用来做PPT，垂直场景够用。

豆包：日常科普问答和英语口语练习，免费好用。

千问（本地部署版）：处理高敏数据和图片识别时使用，数据不出本地，安全底线。

三、扩展阅读：目前主流AI工具分类速查

以下是笔者调研整理的2026年各类常用AI工具，供感兴趣的读者参考。没有全部亲测，只是把目前口碑和使用量比较稳定的选项列出来，大家按需取用。

【编程类】从”会写代码”到”全自动写项目”

这一类工具的演进速度很快，现在已经从”代码补全”进化到了”自主完成整个项目”的程度，主要分两条路线：

AI IDE（带界面的智能编辑器）：Cursor（20美元/月）是目前用户量最大的，基于VS Code改造，Tab补全体验行业最好，支持8个Agent并行开发，适合习惯图形界面的开发者；Windsurf（15美元/月）功能与Cursor相近但价格低一档，跨会话记忆能力不错，适合长期维护同一个项目；GitHub Copilot（10美元/月）是最便宜的入门选择，插件形式可以装在几乎所有主流编辑器里，不需要换环境。

AI Agent（命令行/终端驱动）：Claude Code（按量计费，与Claude账号挂钩）是目前编程Agent能力最强的，直接在终端里运行，能读懂整个代码库、跨文件修改、自动跑测试，架构质量公认最好；Windsurf笔者在用，已经帮忙写了数十个脚本。两者定位不同，很多开发者的选择是”Cursor日常写代码 + Claude Code处理复杂重构”。

一句话建议：编程小白入门选Cursor或Windsurf，有一定基础想要更强自主性的可以试Claude Code。不需要全都订阅，先试一个用顺了再说。

【AI搜索/调研类】让查资料这件事效率翻倍

传统搜索引擎给链接，AI搜索给答案，而且带来源引用，用来调研和核实信息很顺手。

Perplexity（免费/Pro 20美元/月）：回答每一段都附来源链接，信息密度高，调研类内容用得最多，国内需要梯子；秘塔AI搜索（免费）：国内可以直接用的类Perplexity选项，中文资料覆盖好，不想折腾梯子的首选；Kimi（免费/付费）：支持超长上下文，可以把几十份PDF一次性丢进去分析，做文献综述或行业调研报告特别好用。

【图像/视频/数字人类】内容创作的效率革命

这块工具今年迭代最猛，门槛也下降得最快。

图像生成：Gemini自带的Nano Banana Pro（Ultra会员）目前综合效果很好；Midjourney（从10美元/月起）依然是追求图片质量的首选，风格控制最稳定；即梦（国内，字节系）免费额度够日常用。

视频生成：Seedance 2.0是字节的视频生成模型，最近抖音和红果短剧上的大量”漫剧”风格短视频背后用的就是它，笔者未亲测，信息同步；Kling（快手系）在国内也很稳定，效果不错。

数字人：HeyGen（29美元/月）目前效果最好的数字人工具，口型同步和真实感都比同类产品好一个档次，适合做口播视频、产品演示、企业宣传。如果有这类需求，这是目前笔者见过最值得付费的选项。

AI音乐：Suno（10美元/月）和Udio可以用文字描述生成完整歌曲，连歌词、伴奏、人声一起生成，质量超出预期。前阵子那首刷屏的”I’m just a vibe”就是Suno生成的。

【效率/自动化类】少做重复劳动

Notion AI（已集成到Notion工作空间）：已经在用Notion的人直接开，不用换平台，文档总结、会议纪要、知识库管理都很顺；扣子（字节，国内可用）：搭AI工作流的平台，类似OpenClaw但更面向非技术用户，可以用自然语言搭自动化流程；Zapier（有免费版）：连接不同工具之间数据流转的老牌自动化平台，AI化程度也在提高，适合有多个SaaS工具需要联动的场景。

以上工具笔者未全部亲测，定价以各官网最新信息为准，仅供参考。

四、用AI有什么感悟

最大的感触还是这句话：AI已经极大抹平了编程的技术壁垒和信息差。基础的编程问题问AI都能找到答案，Windsurf这类全自动编程软件已经能协助编程小白完成较大型的项目（比如写一个APP，或者做一个交互性很强的网页）。

使用者需要做的，是清晰地向AI传达指令——这背后考验的是产品思维和结构化表达能力，跟技术背景的关系反而没那么大。之前处理一个大型数据表需要一整个下午，现在扔给Claude大概只要半小时到一小时，而且大部分时间都花在输入指令和核对结果上，不再是在做重复劳动。

会不会用AI，已经是人与人之间效率差距越来越大的核心来源。

五、我的OpenClaw实战：三个主力功能

1. 公众号推文全自动发布（1小时→5分钟）

以前写一篇推文：搜信源→查原文→写稿→排版→发布，至少一小时起步。现在通过笔者花了将近一个月、总成本在千元级别调试出来的推文Agent，全流程缩到5分钟。每次生成的token成本大约在5元左右，比人工成本低得多。

2. 碎片信息收集

把看到的新闻链接或者概念直接发给Agent，它会在后台自动解析、打标签并记录，随时供调用。再也不担心”看过就忘”。

3. 接入微信的个人秘书

OpenClaw插入微信后，所有待办事项直接发给它，随时在微信里提醒。基于自然对话的交互，比打开”滴答清单”这类传统app要顺手得多——毕竟微信是一直开着的。

目前这三个是主力功能，新功能还在开发中（比如员工行为管理），有进展再跟大家汇报。

六、最后一个提醒（给国内用户）

对于国内用户，使用OpenClaw等工具最大的门槛在于网络环境和API调用链路。想要稳定调用海外顶级模型，必须通过可靠的API中转站，否则很容易遇到账号被封、调用异常等问题。

笔者自己当初也是付出了惨痛代价——OpenAI账号被封、约200元试错成本、搭进去一整个周末——才摸清这条链路。想要动手实操的朋友，这方面提前做好功课会省很多事。

AI的进化速度不会停下。我们能做的，是尽快把它变成自己手里顺手的工具，而不是旁观者。大家有什么好用的工具或踩坑经验，欢迎评论区交流。