[阐微知界] AI-Ready数据构建平台使用教程

(https://data.nano-bd.com)

阐微知界，AI-Ready数据构建平台

欢迎使用“阐微知界AI Ready 数据构建平台”。以下为平台使用教程，旨在帮助用户快速掌握从非结构化文献到结构化数据的完整处理流程。整个操作主要围绕四个核心环节展开，具体操作流程如下图所示：

图1.文献处理流程图

📌 第一步：数据提取——小样本测试，构建提取配置

在正式批量处理之前，建议先上传少量目标领域的 PDF 文献（如 3～5 篇）。通过平台的智能对话模式，测试和调优提示词及提取配置，直到调试出最适合您的研究场景的提取规则，即可将当前提取配置保存为稳定可用的“数据提取模板”。

👉 具体操作步骤：

1️⃣上传文献

单篇 or 多篇:第一次测试，可以先上传一篇试试手，当然也支持同时上传多篇文献。
文件解析:每次通过「上传文件」上传的文件，都要先经过解析才能提取数据，如果文献已经在平台上传过，通过「选择文件」选中的文件，不用重复解析，既省时间又省费用！

图2.文献处理状态图例——已上传并完成OCR解析

2️⃣ 基础配置

多个主流大模型，自由选择：平台接入了多个主流大模型，你可以根据需求自由切换，灵活又方便。
深度思考，打开效果更好：建议开启「深度思考」模式，输出结果更精准、更贴合你的需求。
字段来源定位，快速回溯原文：打开「字段来源定位」后，提取出的每一项数据都能快速对应到原文位置，查证、比对一目了然。
尽量保留原文语言：系统会尽量保持原文的语言风格。不过，如果提示词中出现了汉语指令（比如“字段为空值时，留‘空’”），可能会输出中文。

图3.文献数据提取基础配置模块示意图

3️⃣结构化输出配置

平台提供自动生成和手动配置两种模式，满足不同习惯和需求。

🤖3.1 自动生成模式：通过对话模式即可完成

对话式需求输入：你只需通过一轮或多轮简单对话，说出自己的需求，平台会自动帮你整理成结构化的字段形式。
基于标准文献生成：也可以上传一篇标准文献，平台会根据文献内容自动提取和整理字段。
无需手动编写复杂提示词，如同自然对话般轻松便捷

图4.自动生成模式界面

🛠️ 3.2手动配置模式：更自由，更精细

用户可以随时在自动生成的基础上直接切换为手动修改，两种方式任选：

可视化编辑器：像搭积木一样，自由增删字段，编辑字段内容和属性，直观方便。
图5.自动或手动生成提示词界面（可视化编辑）
JSON 模式：如果你习惯写代码，也可以直接以 JSON 格式编辑，灵活高效。

图6.自动或手动生成提示词界面（json模式）

💡小贴士：两种模式可以搭配使用——先用自动生成打个底，再用手动模式微调，省时又精准！

最后，全部改完或者退出页面时一定记得要保存/更新配置！！！

图7.保存/更新配置页面

📌 第二步：任务管理——批量提取，一键自动抽取

提取模版配置好后，进入任务管理模块，创建一个新的提取任务。支持批量上传文献（PDF 格式），选择之前验证好的提取规则，平台即自动进行大规模结构化数据抽取。无需人工干预，高效完成从非结构化文本到可计算数据的转换。

👉 具体操作步骤：

1️⃣新建任务组

图8.任务管理页面

2️⃣设置任务名称

3️⃣关联已配置好的提取流程

图9.批量提取新建任务界面

4️⃣上传文献

5️⃣ 提交任务

此时，提取任务已成功创建，系统将自动执行后续提取操作。

图10.批量上传文献界面

图11.提取任务处理状态概览与任务组明细界面

💡小贴士：任务创建后可以随时查看进度，支持断点续传。

图12.支持断点续传的文件提取任务处理界面

📌 第三步：数据校对—— 逐条或抽检修正，形成审核闭环

批量数据抽取任务完成后，所有结果进入校对中心，用户可以根据需求对提取的数据进行逐条或抽检、修正。所有修改记录自动留存，形成“提取—校对—修正—确认”的闭环，助力团队高效协作与质量持续改进。

👉 具体操作步骤：

1️⃣ 进入「校对中心」

2️⃣ 选择需要校对的任务组

图13. 校对中心—待校对任务列表界面，支持按任务组筛选、查看文件校对状态与提交时间。

3️⃣ 选择具体文献

4️⃣ 核对数据并完成修正

核对时点击字段前小地图即可自动跳转到PDF原文对应位置。

图14.数据定位界面

校对过程中若发现错误，无需跳转页面，直接在原位置修正即可。

图15.数据修正界面

📌 第四步：数据导出——归档完成，批量获取结构化数据

校对无误后，数据正式归档。通过数据导出模块，选择不同数据格式（如 JSON、CSV、Excel、zip等），一键批量导出最终的结构化数据集。从此，文献中的知识真正变为可复用、可分析的资产。

👉 具体操作步骤：

1️⃣ 从「任务管理」进入数据预览；

图16.数据预览进入通道

2️⃣ 选择导出方式：

3️⃣ 在「数据导出」模块中直接下载所需文件。

图17. 数据导出页面

图18. 导出数据为csv格式

📌 关于我们

平台链接：https://data.nano-bd.com

联系邮箱：zhaoxx@nano-bd.com

联系电话：18912758985