龙虾养成记:如何用OpenClaw高效整理混乱的Word文档-夜雨聆风

龙虾养成记:如何用OpenClaw高效整理混乱的Word文档

最近我一直在思考：AI的发展如此迅猛，相关的新闻报道铺天盖地，但它到底对普通人的工作与生活产生了多少实质性的影响呢？

观察周围，我发现真实的影响可能远比想象中要小。如今，许多人确实开始将豆包或DeepSeek当作新一代搜索引擎来用，因为它们能直接给出答案，这迎合了人性中“怕麻烦”的一面。但除此之外，大多数人的日常工作方式和生活习惯并没有发生根本性的改变。

要判断AI是否真正融入了普通人的生活，或许只需回答两个现实问题：

你是否愿意像为手机话费充值一样，每月为AI服务付费？
你是否开始与身边的同事、朋友讨论用AI解决具体工作难题的技巧？

我感觉这是一个临界点。你不知道它具体何时到来，但一旦到来，其势头会非常迅猛，让许多没有准备的人措手不及。这让我想起大冰在直播间里说过的一句话：“AI的普及，可能会‘牺牲’掉一到两代人。”

但我们必须清醒地认识到一个关键点：未来取代你的，看似是AI，实际上很可能是你身边最擅于使用AI工具的那个人。

在可见的未来，公司里不可能只剩下老板和AI，但也绝不会像现在一样，需要大量从事重复性、格式化工作的“底层劳动力”。AI本质上仍是一个工具，一个兼具“创造力”与“效率提升”属性的双刃剑：

一方面，它会逐步取代大量标准化、流程化的工作岗位。
另一方面，它又极度依赖能够熟练驾驭它的人。

使用工具从来都是有门槛的。使用方法不同，产生的效果天差地别。

因此，对于普通人而言，拥抱AI的最佳方式，就是每天去使用它、摸索它，把它当成一个需要耐心指导的“实习生”来为自己工作。只有通过日积月累的实践，你才能找到感觉，解决那些别人用AI解决不了的问题，从而建立起自己的独特优势。

举个最简单的例子：即使是与豆包或DeepSeek对话，每遇到一个新问题，你是否会有意识地开启一个新的聊天会话？ 因为原来已解决的问题很可能会面临二次修改，你能否迅速回到之前的聊天窗口，让AI基于原有上下文继续优化？

为什么要这样做？因为这种做法能更好地利用AI的上下文记忆功能，同时避免引入无关的“记忆污染”，从而使AI产出的结果更精准、迭代速度更快。

我的文章一直试图从普通人的视角出发。我本人就是一个普通的“搬砖人”，不那么聪明，效率也很低，更没有精力时刻追踪AI领域的最新进展。事实上，最新的技术未必成熟，我们可以用它来开阔眼界，但不必急于投入实践。真正能让我们能力提升的，永远是日常工作和生活中的那些具体痛点。我们只需要比别人多花一点点时间与AI互动，多进行一点点思考，就能在解决问题的道路上，比身边的人多走出一小步。

对于普通人来说，最关键的或许是有意识地去发现自己工作或生活中，哪些环节可以让AI来协助解决。但这种“问题意识”的建立本身就很困难，因为我们很难克服自身的惰性与惯性。有时，我们宁愿固守那种最耗时、最原始的操作方式，也不愿花时间去和AI“磨合”，更何况这个磨合过程可能还需要付出一些学习成本。

一背景：多人协作文档的格式之痛

最近在工作中，我被分配了一项任务：汇总一份由多人共同编辑的文档。现代化办公越来越强调协同，但现实往往是，需求讲不清，即便讲清了，执行也因人而异。最终交付的文档，字体、字号、段落间距五花八门，格式一片混乱。苦果，只能由最后那个负责汇总的人来承担。

当我拿到那份“百家争鸣”式的汇总文档时，第一反应也是头疼，随即动手手动调整。但改了几个段落就心烦意乱——用格式刷效率低下，且这项工作毫无技术含量。这时我转念一想：为什么不让我的“龙虾”（指本地部署的AI助手）来处理呢？ 让它去对付这些繁琐的格式，我则可以腾出手来处理更有价值的工作，实现“任务并行”。

更重要的是，一旦让“龙虾”掌握了这项技能，以后便可重复使用，一劳永逸。这绝对值得投入时间研究一番。

二初试牛刀：理想与现实的差距

万事开头难。一开始切忌好高骛远，想得太复杂反而难以动手，不如先看看基础效果如何。

我并未抱太大期望，结果也如我所料：直接出现了各种奇怪的格式混乱。此时，大多数人的第一反应可能是“AI不行，还没这个能力”。

但我试着将问题反馈给它，让它继续尝试修改：

打开一看，问题依旧层出不穷：标题格式不一致、缩进不统一、项目符号无法处理，甚至连前几页的电子签字页都乱了套。

还剩这么多问题，明显感觉超出了它当前能力的极限。

这时，大部分人估计就放弃了，觉得还不如自己撸起袖子干。

但我告诉自己：此刻，正是体现个人学习与调试能力的关键时刻。试想一下，如果公司给你安排了一个实习生，他一次就做对的概率有多大？你多半也得耐心地多教几遍。

另一方面，当我们自己还是实习生时，是否也曾因为师傅的需求描述不清而心生抱怨？

最终，只有在不断的沟通与磨合中，才能产出令双方都满意的结果。对待AI，亦是如此。

于是，我去咨询了GPT模型，试图寻找问题的症结。GPT给出了如下回复：

GPT的建议是分步执行，并提供了相应的提示词（Prompt）。于是，我按照如下提示词继续尝试：

然而，大模型依然会“自我发挥”。处理完后我一看，它竟然把我所有的标题都设置成了居中显示，真是令人哭笑不得。

于是，我只能继续督促它修改：

各种千奇百怪的问题又冒了出来，也让我深刻体会到了此类任务的复杂性。因为有些规则极难用语言描述清楚，例如：

有人写了“（1） XXXX”，但这并非真正的项目符号，大模型能否正确识别？
本应是“1.1、1.2、1.3”格式的二级标题，有人却用了“1 2 3”。
标题段落里竟然同时设置了项目符号。

最后，GPT给了我“致命一击”：原来OpenClaw官方的Skill存在天然缺陷，无法满足我的一些特定格式化需求。

至此，我几乎想放弃了。这意味着OpenClaw自带的Skill能力有限，要实现我的需求，恐怕只能通过编写自定义脚本。

三柳暗花明：用Python脚本另辟蹊径

既然不能用现成的Skill，那就让大模型自己编写Python脚本吧。依据GPT提供的思路，经过多轮尝试，我决定先处理最棘手的标题格式。

请编写并执行 Python 脚本处理 Word 文件。 不要使用 docx-skill。 使用 python-docx 库。 处理文件：E:\work\111.docx找到正文中第一次出现的标题“1 简介”，仅从该标题开始处理后续内容，按下面的步骤依次执行。根据 Word 标题样式判断标题级别：Heading 1 → 一级标题Heading 2 → 二级标题Heading 3 → 三级标题Heading 4 → 四级标题第2步完成后，再次按以下规则识别标题层级，防止遗漏：一级标题：形如“1 XXXX”二级标题：形如“1.1 XXXX”三级标题：形如“1.1.1 XXXX”四级标题：形如“1.1.1.1 XXXX”将所有标题的格式统一设置为：字体：仿宋_GB2312字号：四号对齐方式：左对齐段前：0磅段后：0磅行距：1.5倍完成后生成一个新文件，不要覆盖原文件。

这次提示词的重点改动在于：

不告诉大模型从“第几页”开始（它很难理解），而是指定从某个具体的标题文本开始。
将标题所有可能出现的格式（样式和文本特征）都明确列出来。

经过这样处理，标题格式基本就统一了。

接下来，执行第二步，处理正文内容。

请编写并执行 Python 脚本处理 Word 文件。 不要使用 docx-skill。 使用 python-docx 库。 处理文件：E:\work\111_formatted.docx 要求：找到正文中第一次出现的标题“1 简介”，仅从该标题开始处理后续内容。仅跳过真正的标题样式段落（根据 paragraph.style.name 严格判断）：Heading 1, Heading 2, Heading 3, Heading 4, TOC Heading。不要根据字体或内容猜测。其它所有段落都按正文处理，统一设置：中文字体：仿宋_GB2312西文字体：Times New Roman字号：四号（14pt）删除段首的 Tab 和手动空格缩进。清除所有原有段落缩进（左、右、首行、悬挂均设为0）。设置段落左对齐。重新设置：首行缩进 = 28磅（2字符），段前 = 0，段后 = 0，行距 = 1.5倍行距。保持标题格式不变。保持图片、表格、自动编号、页眉页脚不变。生成新文件：E:\work\111_formatted_v2.docx

经过这两步处理，感觉已经达到了当前“龙虾”所能处理的极限。

核心心得：当你要执行的任务比较复杂时，一定要分步进行。大模型的能力（或者说我们目前能免费/低成本使用的模型能力）仍然有限，或者我们尚未掌握“唤醒”其更强能力的方法。

最后，人工检查依然是必不可少的。因为人类创造的内容千奇百怪，总有一些“惊喜”在等着你。例如下面这个内容，这两行竟然同属一个段落，我都无法理解原作者是如何“创作”出来的。

因此，这类文档整理的最终环节仍然需要人工核对。规则实在太多、太细，很难全部用语言向AI描述清楚。在这个过程中，我遇到了各种问题，包括大模型的“幻觉”，着实让我感慨其能力的边界。

最终，大约90%的繁琐工作由AI完成了，剩下的10% 仍然需要我们手动微调。但即便如此，效率的提升也是巨大的。

四额外尝试：流程图生成的挑战

最后，我又测试了另一个场景：根据文档中某个标题下的内容，让AI自动生成一张流程图并插入文中。

它确实生成了一张图，但我只能用“魔幻”来形容，完全无法使用。又尝试了好几次，始终解决不了一个关键的箭头指向问题，最终只能放弃。

后来，Claude给出的回答更让人“伤心”，直接坦言目前免费模型能力有限：

看来，不付费使用更强的模型，这类复杂图形生成问题暂时无解。下次有机会，或许可以试试小米或GLM-5等国产模型。坦率地说，Minimax在这类任务上的表现确实不太理想。

五尾声与展望

最后，我偶然发现，像“通义千问”这样的AI应用桌面端，其实也集成了一些Office文档处理功能。简单尝试了一下，处理一些基础的表格整理工作还是可行的。

当然，使用这类云端APP存在两个明显问题：一是通常有文件大小限制，二是涉及敏感内容的文件不适合上传。这也是我始终坚持训练“本地龙虾”的重要原因——所有文件都在本地处理，数据安全可控。如果有一天公司内部部署了离线大模型，我的工作流几乎可以无缝切换过去。

每一次这样的探索与学习，都是一次微小的成长。很多人可能认为，等到AI完全成熟后再直接使用“成品”效果更好，现在没必要深入参与。但正如一位博主所说：每当我们成功完成一件事后回头看，关键的突破往往就那几步，但通往那几步的所有弯路，其实一步都少不了。

现在的每一分摸索，都是在为未来那个“AI真正普及”的时代，提前铺路。

一 背景：多人协作文档的格式之痛

二 初试牛刀：理想与现实的差距

三 柳暗花明：用Python脚本另辟蹊径

四 额外尝试：流程图生成的挑战

五 尾声与展望

一背景：多人协作文档的格式之痛

二初试牛刀：理想与现实的差距

三柳暗花明：用Python脚本另辟蹊径

四额外尝试：流程图生成的挑战

五尾声与展望