乐于分享
好东西不私藏

文档解析Skill与Agent高精度上下文

文档解析Skill与Agent高精度上下文

当Agent真正进入企业和真实业务

瓶颈不是模型会不会思考,而是没有高精度的上下文

现在,这个头部企业生产环境在用的解析引擎

接入了龙虾生态,并免费开放

每日 1000 页额度,零门槛上手

让Agent更懂业务,解析不再成为项目卡点

这可能是离商业级文档解析能力最近的一次

4月27日19:00,合合信息TextIn xParse Skill线上公开课

从安装演示到llm.wiki,再到常见文档解析工具对Agent的效果对比

在每天都有一个AI“新概念”要学的时候

我们聊点好玩、实在、又实用的

感兴趣的小伙伴,欢迎扫码入群观看

对企业级开发者和 OpenClaw 深度玩家来说,商业级的稳定性、可用性和效果是能把产品真正跑在生产环境里的保障。

现在, OpenClaw 里和 Agent 说一句话,你就能把 PDFWordPPTExcel 甚至长截图,各种真实场景下复杂的文档变成干净的 Markdown

它的核心能力很简单,却很扎实:

  • 多种版面元素高精度解析,提升大模型表现:精准识别标题、公式、图表、手写体、页眉页脚、跨页段落,精准还原坐标。

  • 行业领先的表格识别能力:一键解决合并单元格、跨页表格、无线表格、密集表格等识别难题。

  • 阅读顺序还原准:理解、还原文档结构和元素排列,确保阅读顺序的准确性,支持多栏布局的论文、年报、业务报告等。

  • 支持多种扫描内容:能良好处理各类图片与扫描文档,包括手机照片、截屏等内容。

  • 强大的图像处理能力:文件带水印、图片有弯曲,都能一键解决,排除图像质量干扰。

使用方式:

不用写代码、不用调 API。

在 OpenClaw、ZeroClaw、Claude Code等 Agent 平台装上 xparse-parse Skill,只需要说一句话,它就能自动完成文档解析、格式转换全部流程。

你可以这样说:

"帮我读一下这份PDF合同,提取关键条款""把这个报告转成Markdown,保存到桌面""这份加密PDF密码是123456,帮我解析前10页""提取这张表格图片里的内容,输出JSON"……# 更多高阶玩法,等你探索

支持格式: 

PDF、图片(jpg/png/bmp/tiff/webp),免登录免费使用,每日上限1000页;

更多用量或更多格式( Word/Excel/PPT/HTML/OFD 等20+常见格式),可在配置 TextIn 账户凭证后解锁。

安装方式(二选一):

方式一:通过各类Agent或Claw安装

在 Agent 对话框直接说:

帮我从 技能市场 安装 intsig-textin/xparse-parser如果技能市场里没有,则通过npx安装:npx skills add intsig-textin/xparse-skills --yes如果npx也没有,则可以从以下仓库里任选一个手动安装:https://github.com/intsig-textin/xparse-skills;https://gitee.com/intsig-textin/xparse-skills

方式二:手动安装

从以下任一地址下载 zip 文件,解压后,放到 agent 对话框,让模型使用解压里面的 skill.md 文件即可:

  • GitHub:

    https://github.com/intsig-textin/xparse-skills

  • Gitee:

    https://gitee.com/intsig-textin/xparse-skills

  • ClawHub:

    https://clawhub.ai/intsig-textin/xparse-parser

每日1000页,先用起来。

4.27,更多惊喜。