我让OpenClaw帮我整理了291篇飞书文档,结果出人意料
你有没有这样的经历——
打开飞书,想找一份上周写的方案,翻了好几页没找到。于是换搜索,输入关键词,出来几十条结果,前几条不是你要的,翻了三页才找到。
又或者,你想盘点一下团队的知识沉淀,打开知识库——4个空间,有的空间几十篇文档,有的空间只有零星几篇。再看看根目录,好家伙,各种文档、表格、幻灯片散落一地,有的连标题都忘了是什么意思。
你心里清楚:这些文档里藏着很多有价值的资产——培训课程、项目复盘、方法论沉淀。但它们就像堆在仓库里的东西,你知道有,就是找不到。
这就是典型的"数字囤积症":文档越积越多,但从不整理,最后变成一个巨大的数字垃圾场。

前阵子我实在受不了了,决定彻底整理一下飞书文档。但我没选择手动一个个归类——我让OpenClaw帮我做了这件事。
先看看"灾难"现场
我先盘点了一下飞书文档家底:
知识库:4个空间,55篇文档

云空间(非知识库):根目录136个 + 13个子文件夹100个 = 236个文档
总计291篇文档。不算特别多,但已经到了"知道有、找不到"的地步。

更要命的是,这236个非知识库文档完全没有分类。有公众号文章草稿、有临时笔记、有培训课程材料、有项目文档……全混在一起。
为什么不让OpenClaw试试?
整理文档这件事,本质上是三步:
① 扫描——把所有文档列出来
② 分类——根据内容/标题给每篇文档打标签
③ 可视化——用一个清晰的方式呈现结果
扫描和分类这种重复性工作,正是Openclaw擅长的。可视化可以用飞书的多维表格——自带筛选、分组、图表,比Excel还好用。
工具选择上,我用了飞书的命令行工具 lark-cli。为什么不用图形界面手动整理?因为291篇文档,手动归类起码得半天。为什么不用Python直接调API?因为lark-cli已经封装好了认证和调用,
首先安装飞书CLI:
👤 安装飞书命令行工具 lark-cli仅需要一句话:
👤 帮我把飞书上的文档都整理一下,知识库和云空间的都要,最后用多维表格做个可视化索引动手:四步完成文档整理
第一步:扫描知识库
提示词:
👤 扫描飞书知识库,把所有空间的文档都列出来,递归遍历每个空间飞书的知识库有专门的API。我让OpenClaw递归遍历了4个知识库空间,把每个节点的信息都拉了出来,最终收集到55个文档。
这些文档因为有知识库的组织结构,还算好找。真正的重灾区在云空间。
第二步:扫描云空间散装文档
👤 根目录的扫完了,子文件夹里的文档也要全部扫出来云空间没有知识库那样的树形结构,文档就是平铺在根目录和子文件夹里。先用 drive files list API 扫根目录——136个文档。然后逐个检查子文件夹,又扫出13个子文件夹、100个文档。
总计:236个非知识库云文档,零分类,零组织。
第三步:OpenClaw智能分类
👤 根据文档名和类型,给这236个文档分一下类这是最有意思的一步。把236个文档的名称、类型、路径信息喂给OpenClaw,让它根据语义自动归类。OpenClaw分出了20个类别:
公众号文章草稿(82篇)——数量最多,说明内容创作是主要用途
临时/空文档(33篇)——随手创建但再也没打开过的文档
组织经验萃取(13篇)——方法论和经验沉淀
培训/课程(12篇)——培训材料和课程设计
OpenClaw工具与效能(10篇)——OpenClaw相关工具的探索记录
个人成长/反思(8篇)——思考和复盘
看到"临时/空文档"有33篇的时候,我有点尴尬。这就是数字囤积的代价。
第四步:搭多维表格 + 做仪表盘
👤 在原来的多维表格上加一个新表,把这236个文档写进去,再做个仪表盘分类完成后,把所有文档信息写入飞书多维表格。表格设计了6个字段:
• 文档名称——一眼看出是什么
• 文档链接——点击直达原文
• 文件类型——文档/表格/幻灯片/多维表格等
• 分类——OpenClaw自动打的标签
• 所在位置——根目录还是哪个子文件夹
• 备注——补充说明
236条记录,批量写入,几秒钟搞定。

然后是最有成就感的环节——仪表盘。在多维表格里创建了一个"云文档总览"仪表盘:
• 总数指标卡:236,一目了然
• 饼图:各类文档的占比分布
• 环形图:文件类型的分布
• 柱状图:文档在哪些位置最多
• 条形图:分类数量排行榜


看到仪表盘的那一刻,之前"一团乱麻"的感觉彻底消失了。
踩坑实录:权限授权的"血泪史"
👤 除了知识库里的文档,其他的云文档你也帮我整理一下整个过程中,最折腾的不是技术问题,而是飞书的权限授权。
事情起因很简单:OpenClaw工具需要访问飞书文档,需要授权。但飞书的权限体系比较复杂——不同的API需要不同的scope(权限范围),而有些scope默认不包含在推荐授权列表里。
我经历了大约5轮"发起授权→等待→链接过期→重新发起"的循环。问题出在哪?
问题1:授权链接有效期很短(约600秒),但人和OpenClaw之间的来回对话延迟不可控。OpenClaw发给我链接,我回复确认,这个过程可能就过了有效期。
问题2:有些scope不在默认推荐列表里,只有调API报403之后才发现缺了。
最终解法:用"两步走"模式——告诉Openclaw先异步获取授权链接(不阻塞),点确认后,再让它用 device_code 完成授权。链接不会过期,流程也不卡。
整理完文档之后
说实话,看到仪表盘那一刻,最大的感受不是"技术多厉害",而是——我应该早点做这件事。
我们每天都在产生文档,但很少停下来整理。就像房间里堆满了东西,你每天走过,假装看不见。直到有一天你打开衣柜,发现三分之一是再也不穿的衣服。
这次整理让我想通了几件事:
文档存了但找不到,等于没存。定期整理不是"有空再做"的事,而是AI时代知识管理的基本功。
踩坑花了不少时间,但找到解法后写进工具记忆,以后就不会再犯。这才是AI时代正确的学习方式——不是记住所有细节,而是把解法沉淀成可复用的流程。
如果你也有飞书文档整理的需求,推荐你试试这个方法。工具不难,难的是迈出"开始整理"这一步。
💡 想了解更多AI效能提升技巧?
如果你也想用AI提升效能,欢迎添加我免费进入合一AI效能实验室。
让我们一起探索AI时代的工作新方式,把重复性工作交给AI,专注于更有价值的创造。

夜雨聆风