试用Ima知识库,基于文档的信息提取与分析
试用Ima知识库,基于文档的信息提取与分析
一、试用目的
测试根据用户指令,从提供的结构化文档中提取、汇总、筛选特定国家标准信息的能力,并按要求格式化输出。
二、试用结论
本次试用表明,系统能从结构化文档中提取、格式化、筛选特定信息。
主要不足在于:
1.简单表(仅6列)处理长度只有300余列;
2.基于本次使用的问答有卡顿,在PC端尚可等待,在移动端难以持续;
3.基于知识库的问答仍然出现幻觉。
三、试用步骤与效果
知识库中原有1个其它文档,导入 5个关于发布国家标准的网页链接,5个网页均为文档,标准数分别为14、3、48、261、369,共695项。
步骤1:从知识库中提取标准信息
• 指令:从提供的所有文档中提取标准信息,并按照“2025年第39号公告”的表格格式进行汇总,同时增加“公告文号”列。
• 执行效果:
成功定位:从知识库中6个文档中准确识别出5个相关文档。
格式正确:在“2025年第39号公告”的表格格式基础上,增加“公告文号”列,合理放在第二列。
序号递增:提取第二个文档时,序号承接上文。
提取不全:提供的5个文档中共有600多个标准,整理出的表格序号最后为320。
(由于篇幅限制,以下步骤简化)
步骤2:完整提取所有标准
指令:完整汇总所有提供的全部693个标准
步骤3:从指定公告中完整提取所有标准
指令:从“2025年第38号公告”的文档中提取标准信息,按表格格式,增加公告文号栏。
步骤4:基于关键词进行跨公告筛选
指令1:请提取卫生健康和中医药相关的标准,按原来表格格式,保留序号不变
将分次提取出的共695项标准汇总成《近期发布的国家标准》,导入知识库中。
指令2:从《近期发布的国家标准》中提取卫生健康和中医药相关的标准,按原来表格格式,保留序号不变。
四、试用总结(IMA生成,仅干点子)
1.效果
信息提取准确
格式理解与适配能力强
逻辑筛选有效
交互响应良好
2.不足与待优化点
细节一次性完备性
处理超长内容的展示
关键词筛选的边界
五、优化建议
1.作为知识库应用,建议适当增加输出长度和交互容量,以适用标准文献、政策文件等结构化信息的快速查询与整理工作需要。
2.建议点击“笔记”后仅打开笔记目录栏,由用户选择打开具体笔记;现在是默认打开上次退出文档,要先退出才能记新笔记或打开其他已有笔记。
夜雨聆风
