文档解析Skill与Agent高精度上下文
当Agent真正进入企业和真实业务
瓶颈不是模型会不会思考,而是没有高精度的上下文
现在,这个头部企业生产环境在用的解析引擎
接入了龙虾生态,并免费开放
每日 1000 页额度,零门槛上手
让Agent更懂业务,解析不再成为项目卡点
这可能是离商业级文档解析能力最近的一次
4月27日19:00,合合信息TextIn xParse Skill线上公开课
从安装演示到llm.wiki,再到常见文档解析工具对Agent的效果对比
在每天都有一个AI“新概念”要学的时候
我们聊点好玩、实在、又实用的
感兴趣的小伙伴,欢迎扫码入群观看
对企业级开发者和 OpenClaw 深度玩家来说,商业级的稳定性、可用性和效果是能把产品真正跑在生产环境里的保障。
现在,在 OpenClaw 里和 Agent 说一句话,你就能把 PDF、Word、PPT、Excel 甚至长截图,各种真实场景下复杂的文档变成干净的 Markdown。
它的核心能力很简单,却很扎实:
-
多种版面元素高精度解析,提升大模型表现:精准识别标题、公式、图表、手写体、页眉页脚、跨页段落,精准还原坐标。
-
行业领先的表格识别能力:一键解决合并单元格、跨页表格、无线表格、密集表格等识别难题。
-
阅读顺序还原准:理解、还原文档结构和元素排列,确保阅读顺序的准确性,支持多栏布局的论文、年报、业务报告等。
-
支持多种扫描内容:能良好处理各类图片与扫描文档,包括手机照片、截屏等内容。
-
强大的图像处理能力:文件带水印、图片有弯曲,都能一键解决,排除图像质量干扰。
使用方式:
不用写代码、不用调 API。
在 OpenClaw、ZeroClaw、Claude Code等 Agent 平台装上 xparse-parse Skill,只需要说一句话,它就能自动完成文档解析、格式转换全部流程。
你可以这样说:
"帮我读一下这份PDF合同,提取关键条款""把这个报告转成Markdown,保存到桌面""这份加密PDF密码是123456,帮我解析前10页""提取这张表格图片里的内容,输出JSON"……# 更多高阶玩法,等你探索
支持格式:
PDF、图片(jpg/png/bmp/tiff/webp),免登录免费使用,每日上限1000页;
更多用量或更多格式( Word/Excel/PPT/HTML/OFD 等20+常见格式),可在配置 TextIn 账户凭证后解锁。
安装方式(二选一):
方式一:通过各类Agent或Claw安装
在 Agent 对话框直接说:
帮我从 技能市场 安装 intsig-textin/xparse-parser如果技能市场里没有,则通过npx安装:npx skills add intsig-textin/xparse-skills --yes如果npx也没有,则可以从以下仓库里任选一个手动安装:https://github.com/intsig-textin/xparse-skills;https://gitee.com/intsig-textin/xparse-skills
方式二:手动安装
从以下任一地址下载 zip 文件,解压后,放到 agent 对话框,让模型使用解压里面的 skill.md 文件即可:
-
GitHub:
https://github.com/intsig-textin/xparse-skills
-
Gitee:
https://gitee.com/intsig-textin/xparse-skills
-
ClawHub:
https://clawhub.ai/intsig-textin/xparse-parser
每日1000页,先用起来。
4.27,更多惊喜。
夜雨聆风