公司网盘最吓人的地方,不是文件多,而是每个文件看起来都像“可能有用”。这篇我不讲知识库大工程,只讲一个小做法:用 Claude Code 或 OpenClaw 先扫一个测试文件夹,把合同、申请单、制度、报告整理成一张分类表。
前几天朋友找一份去年的供应商合同。
她一开始搜“供应商”,出来一堆报价单;搜“采购”,又混进来好几份申请单;最后搜“盖章”,总算翻到几个像样的文件。
文件名也很有办公室味:
合同终版.docx 合同终版最终.pdf 采购协议-法务意见.pdf 盖章扫描件.pdf 新建文件夹(2)
她发我一句:“我现在不是找不到,是不敢确定。”
很多文档库就是这样,平时没人觉得乱,真到要给老板、客户、财务发材料的时候,心里突然没底。
先别让 AI 大包大揽
我以前也犯过一个错:把一堆文件扔给 AI,说“帮我整理分类”。
它很快给我分好了:
重要文件 / 业务文件 / 参考资料 / 其他看着挺干净,其实没法用。
因为第二天你还是不知道付款申请该放“重要文件”还是“业务文件”。法务要找合同条款,财务要看付款节点,业务只想确认交付范围。大家找同一份文件,脑子里的入口根本不一样。
所以我现在会换个做法:不让 AI 先分文件夹,而是先让它做一张表。
如果用 Claude Code,我会新建一个测试文件夹,先放 30 到 50 份不太敏感的文档进去,让它读取文件名和正文,输出一个 document-classification.csv。它能读文件、跑命令、写结果文件,这种本地小整理很顺手。
如果用 OpenClaw,我会把这件事拆成一个固定流程:读取测试文件夹、识别正文、分类、写表格、标出需要人工看的文件。OpenClaw 的 skill 好处是能复用,但我会先看权限。来路不清的第三方 skill,不要一上来就给它公司合同目录。
我参考的 document-classification-nlp 也是类似思路:先把文档内容取出来,再判断它像合同、规范、提交材料,还是别的类别。办公场景里不用讲得太技术,能落地就行。
我会先填这 4 列
刚开始别做太复杂。字段越多,越容易半途而废。
比如一个文件叫“项目资料.pdf”,这名字基本等于没名字。
但如果表里写成:
文档类型:验收报告业务对象:A 客户项目使用场景:回款前验收风险等级:高你下次找它,至少知道该从哪里下手。
大概流程可以这么跑:

这里别追求一步到位。第一轮能把 50 份文件排个大概,就已经比“全靠搜索文件名”强很多。
分类表长这样就够了
我会先用这种表,不急着上系统。
真正有用的是“建议位置”和“人工看”这两列。
前者帮你发现大家归档习惯不一样。有人按部门放,有人按客户放,有人按月份放。后者提醒你别偷懒,尤其是合同、付款、盖章、报价这几类文件,AI 分得再像,也要留个人看。
Claude Code 里可以这样说
请扫描当前文件夹里的文档,帮我做一张文档分类表。尽量结合文件名和正文判断,不要只看标题。如果 PDF 或扫描件读不出正文,请标记为“需 OCR”。表格字段:文件名、文档类型、业务对象、使用场景、关键日期、风险等级、建议存放位置、是否需要人工确认、判断依据。文档类型从这些里面选:合同、申请单、制度规范、报告、会议纪要、发票票据、其他。规则:不确定就写“需人工确认”,不要猜。合同、付款、盖章、报价、客户承诺类文件,风险不要标低。请把结果保存为 document-classification.csv。我会特别看“判断依据”这一列。
AI 说某个文件是合同,可以,但它最好告诉我依据是“违约责任”“付款条款”“双方盖章”。如果只给一个分类结果,我不太敢直接用。
用 OpenClaw 的话,我还会多加一句:
只处理我指定的测试文件夹。执行前先列出需要的权限,不要访问桌面、下载、浏览器缓存、账号凭据和其他目录。这句看着啰嗦,但公司文档真不能随手放开权限。
先从这几类文件试
别一上来扫全公司网盘。先挑一个小范围,比如一个项目、一个供应商、一个月的行政申请。
我会优先拿这几类:
第一轮跑完,常见问题不是 AI 不聪明,而是公司叫法太随意。
同一类东西,行政叫“采购申请”,财务叫“请购单”,业务叫“需求申请”。谁也没错,就是搜起来很痛苦。
我一般会单独做一张同义词表:

别急着改历史文件名,先把叫法对齐。这个动作很小,但后面省很多时间。
有些文件,必须人看
我不建议把文档分类做成全自动。
合作备忘录里可能藏着付款承诺;扫描件最后一页可能才有盖章;附件清单里可能写着真正的交付范围。AI 很容易把主体页看懂了,却漏掉边角上的关键信息。
所以我的规则很土:
低风险自动归档,中风险抽查,高风险必须人工确认。
尤其用 OpenClaw 这类能调用本地文件和外部服务的工具,第一轮只跑测试文件夹。跑完先看三件事:分类有没有离谱的,权限有没有多要,导出的表格同事看不看得懂。
都没问题,再扩大范围。
我见过一个文件夹叫“最终版-不要删-旧”。看到这个名字的时候,我沉默了几秒。
你们公司最乱的文件夹叫什么?可以留言丢一个名字。下一篇我可以挑几个真实场景,直接改成分类字段和提示词。 技能参考链接:https://modelscope.cn/skills/%40datadrivenconstruction/document-classification-nlp
夜雨聆风