你有没有这种崩溃时刻?老师发来一份扫描版PDF教材,或者同事甩来一张截图合同,里面全是字,但就是选不中、复制不了。

以前我只能手打,或者用那种免费OCR网站,画质差一点就翻车,还担心隐私泄露。
直到我发现了 Hermes 的「OCR-and-Documents」技能——它能把PDF、扫描件、图片里的文字,直接变成干干净净的 Markdown。
你可能会想:不就是截图转文字吗?
不不不,它连表格都能识别。我专门拿了一张带表格的合同去测,它把表头、行列数据全还原成了 Markdown 表格,AI读起来超顺畅。
更贴心的是,它支持按文档为单位处理。你传一张图、一整个PDF甚至多图打包,它都会逐个识读,最后输出一个干净整洁的 Markdown 文件。我试过把一本扫描版小说扔进去,它居然连段落都没乱——直接出来就是章节分明的 Markdown,我顺手喂给了 AI 让它帮我写摘要。
怎么装、怎么用
none hermes skills search ocr-and-documentshermes skills install <skill-id># 进入对话后直接说:# “帮我把这个 PDF 提取成 Markdown”# 或者:# “把这个文件夹里的扫描件全部 OCR 一遍,再按文件名输出成 Markdown”
整个过程快得离谱,一个10页的PDF大概十几秒就搞定。而且本地运行,文件不用上传到任何云服务器,隐私安全都在你自己手里。
以前看到扫描件我就头疼,现在看到扫描件反而窃喜——又能测技能了。如果你也总跟 PDF、截图、扫描件打交道,这个技能真能帮你省下大把抠字的时间。快去试试,回来告诉我你的第一份「抢救」回来的文字是什么。
点击下方[AI池匠]关注我
觉得有用的话,点个♡,让更多需要的朋友看到。
夜雨聆风