当前时间: 2026-03-06 17:13:10
分类:软件教程
评论(0)
Ima知识库应用的几点分享
Ima知识库应用的几点分享
0、引言
简单回溯下我使用ima的过程,形成了阶段性的总结文档(简单类比封装成openclaw的skills)
1)IMA是什么?
①腾讯出的,用的deepseek和腾讯自己的模型(差点意思,但由于知识库使用的是RAG压缩生成而不是大模型的tokens概率生成,差一点也能接受);
②知识库,你自己的数据资产,可以交给他管理,目前市面上我还没有发现比IMA更好交互的管理工具;
这点很重要,相比于豆包等通用大模型,ima具有长期的资产可积累性,更利于团队共享协作,降低幻觉(仅基于你的知识库执行任务),免费(flomo浮墨笔记软件一年会员费近百元)。缺点就是内嵌模型跟国际领先SOTA比起来,差得不是一点半点。
2)IMA能干什么?
IMA官方知识库给了我很好的提示。三类场景:专业服务、团队协作、个人学习;三类核心功能:知识库管理、问答、创作。
1、知识库管理
1)数据类目
以下是ima官方给的指引,大体是这些,但过于泛化了,不太具有针对性。
这个其他,涉及到一些语音、视频类的资料,转化为可读性更强、文件空间更小的文本、图像资料,那首先第一步是要去各种网站上把语音、视频类的资料donwnload下来。
d.抖音长视频,使用Parsevideo下载→上传至通义听悟→提取方案
e.视频号长视频,使用GitHub工具wechatVideoDownload下载→上传至通义听悟→提取方案
网盘下载链接:https://pan.quark.cn/s/02054d6f9664
f.播客,在chrome或edge浏览器安装cosmos enhanced插件→复制小宇宙APP的播客音频链接→若文件≤200M,将音频上传至ima解析;若>200M,上传至通义听悟→提取方案。
以下是我个人的知识库一级类目,没有系统去梳理过,偏随意。
② 微信聊天、微信收藏、公众号或浏览器文章转存;如果是浏览器,需要安装下ima的插件;
③ 个人文件或文件夹批量上传;这里最好是能够上网的数据,单位的一些敏感数据,最好慎重。
④ 笔记或问答结果转存;有些与AI交互的精华可以转存到笔记中,单个笔记支持上百万文字,如下:
⑤ 录音纪要或录音上传;这点是很好用的,比如我们去参加行业的会议、培训会、项目专家会或者领导甲方讲话,都可以录音,放进去,形成知识库素材,如下截图:
2)tips
AI工具能提高效率,是种诱惑,但个人也要注意采取一定的措施;简单假设ima属于腾讯大厂的,不太能把用户的隐私出卖,但始终还是要注意。
一是不要以为ima知识库内的文件设置为「不可查看」就以为万事大吉了,如果知识库分享出去,别人可以看到你知识库的文件名、AI摘要,然后通过「提示词」可以逆向工程把你的内容用ima导出来;
二是涉及个人数据(比如体检报告、私人笔记)或单位数据(比如工作文档),放在「个人知识库」中,不要放入「共享知识库」中,更不要发布到「知识广场」上。
2、问答与搜索
1)应用场景
① 标准库的知识;比如某个规范、某条政策、某类规划案例的查询;
② 某某大佬的某个观点,我们印象中大佬讲过,知识库里面也有相关资料,比如录音,则可以问ima原文是什么、出处在哪里;
2)tips
这个涉及到「提示词」,也就是AI交互了,是一门大学问,一时半会儿说不完,我还在学习,在这里也不赘述了。大体记录几个tips:
① 打标签;对部分重要的数据文件,可以打上「#标签」,这样可以针对某标签提问,针对性更强,因为模型不是万能的,如果知识库文件太多,有可能超过了模型的检索能力边界,导致找不出来,所以我们如果能够准确缩小范围,对于结果应该是有用的。
② 分场景提问;需要个人对知识库的内容较为熟悉,知道你所要问的问题,大体在哪里。可以基于「标签」提问,可以基于「知识库」提问,也可以基于「文件夹」提问,甚至可以基于单个文件提问,用多了,自然就知道了。
③ 精华问答即时转存至笔记;这点很容易忽略,因为在上千个文件的知识库中提问,当你想回溯你之前的问题或者接着提问的时候,你很难记得住你曾经在那个文件夹或文件里面提过问题了,这个时候,你找笔记是最好的,而笔记,反过来,又可以加入知识库,形成你的知识素材。
④ 不要完全相信ima给的数据或回答;要去核实下,头脑中对ima给的结果如果有一丝的怀疑,都要点进「引用文献」去核实数据来源。
⑤ 个人需要有对模型能力的判断力;有时候,可以用ima去问然后自己去核查;也可以调用gemini等更强的通用模型去问,也许会有意想不到的结果。
ima的结果如下,居然没有2021年的数据,不科学,这时候只能自己去查ima中的2021年的财报:
而gemini结果如下,跟ima给的数据是对得上的,多了某年份的背景信息,也补齐了2021年的数据:
gemini甚至还给出的具体的上下文解释,如下截图:
因此,在这种「非私有化数据」的场景下,通用大模型能力更强。
那为什么我还是在知识库中丢了「交通行业上市公司财报」的数据资源呐,直接问gemini3不就好了吗?我自己想的是,上市公司财报是高质量的数据资产,里面不仅有经营数据,更有某些细分的行业的发展趋势,是管理层那帮大佬一年一度写出来的,是值得我们个人的知识库作为高质量数据源进行引用的,另外一点,我反正先把我的知识库数据资产建立起来,ima的模型能力将来某一天会升级的,当模型也变得厉害的时候,有可能会生成不一样的、更好的东西,交给时间。
3、内容创作与协作
1)生成PPT
目前生成的PPT字太多,字过小,图太少,不太美观,更像是对外发布的报告,而不符合PPT阅读习惯;生成时间过长,32页PPT,耗时近1小时14分钟,着急的时候,只能干着急。
2)生成报告
这个功能我应用相对多一些,可以生成整体报告(还可以用任务模式-深度报告),也可以生成几段话(创作或修改),可以在笔记里面生成内容。
写个人总结可以用,写标书可以用,写论文其实也可以用。
关键是要喂给模型合适的「知识」,这就是第一步里面的「知识库管理」的内容,是一个长期迭代积累的过程。
3)生成播客
如果没做自媒体,用处不是很大,但这个功能其实ima做得还不错,语音较为真实。
4)生成流程图
这个功能比较适用。可以基于知识库的单个文件进行「总结内容」,转存到笔记里面,根据自己的理解进行内容调整与修改,再针对笔记生成「流程图」,流程图可以导出图片,也可以导入到xmind软件里面再创作「如换主题、改内容或持续更新内容」。
5)分享
这个功能也比较适用。自己写的笔记可以导出为PDF文档,分享与人;知识库生成的内容也可以按「长图」模式分享与人。
6)tips
① AI意识。拿到一个活,先想一想,AI有没有可能帮我,知识库有没有可能帮我先理一下,比如去年写一个院内课题申请的报告,时间比较紧,我就想用AI帮我写,首先是喂资料,我把知网上相关的「核心期刊」论文、院内相关的报告(可上网的那些)、搜一搜出来的相关的公众号文章,喂给IMA,然后整体写一个。不行,但可以提供思路,拓展思维;然后我会结合领导的想法及自己的思考,理一个简单的框架(这一步,AI目前只能是辅助,就跟AI做PPT一样,可以自动生成,但效果不理想),然后分别再逐段找IMA帮我写。
为什么不用通用大模型,是因为那些写出来的东西,太空,太泛,很可能更不好用,如果把自己的内容喂给通用大模型比如gemini让它去写,写出来的质量也许要好一些,但麻烦,知识库管理远不如ima来得好。
② 找应用场景。学ima的技能,是死的知识,很简单,有个技术文档即可,或者看别人的帖子即可,一抓一大把,但更为关键的,是要找到自己的应用场景,一步步真地去用,去迭代自己的技能,这样才能更好地与AI交互。比如,对我来讲,比较适用的一个技能,好比我有个框架,把一些相关资料给ima帮我写了个初稿,然后我去找甲方或者专家汇报,汇报过程中我会做PPT,也会在汇报的时候用IMA录音,回来后,我就可以结合领导的要求或自己的新想法写提示词,基于录音或汇报文件,让IMA再帮我重新修改报告,这是很适用的,它能够将那些以前的「祼数据」用活,要在以前,可能专家会也会录音,但录了也就永远躺在手机里面了,也不会去看它,还占用内存,而现在,ima录音可以自动生成纪要、可以自动转文字方便我位拉着看或者查询某位领导讲了什么话,也可以基于ima录音进行干次创作,这个小小的场景,就把工作流都与AI能力结合起来了。
③ 去掉AI味。AI目前我觉得还是以辅助为主的,因为它没有人类的「社交、工作、生活」等等「上下文」,哪怕openclaw,也只能局部的上下文,所以,AI还做不了80%的数字分身,这是输入端;而过程端,IMA的模型能力还不强,还存在幻觉,当然只可以等着模型升级,但我们还是要先用起来,IMA写的东西,跟notebooklm好像差不太多,但相比gemini3 pro来讲,我觉得「人味」要少,它喜欢制作一些双引号括起来的新概念,喜欢在段落里面打些冒号,喜欢写一些大词空词,这些,我们都没有办法在当前阶段直接把「AI生成的报告」直接交出去,而是要借助AI的部分能力,融入到我们的工作流中去,提升效率。
对于这一点感触,有点类似于我在学习研究AI生成PPT的最终结论一样,AI只是提供思路,辅助框架,做素材,但最后进行「系统集成」的那个,还是我们这个「拥有足够多的上下文」的人类生物智能体。
4、应用实例
1)使用ima查阅财报中的行业信息
以下是ima回答的结果,我转存到笔记「0-临时」中,就可以分享成长图了:
之后,可以让ima对文件夹或者单个文件进行总结,画脑图,辅助我们认识整体这个文件素材的概要,以便于提问。
然后,每个人就可以发挥自己的主动性,在好奇心的驱使下,与AI进行对话了。可以让IMA给你出问题、优化提示词,也可以你反驳他的答案让其重做,比较简单,不演示了。
2)使用ima进行写作
step1.使用「任务模式」生成报告,会花点时间。
step2.ima写出来的文章,AI味太深厚(是我提示词的原因),将文章转存为ima笔记,如下截图:
step3.ima写出来的文章,还有有点生硬(我提示词的原因),采用ima的帮写功能(实际上,我自己的习惯,我会让gemini3 pro也写一篇,然后导入ima笔记,再让ima的AI在帮写),如下截图:
step4.然后针对其中某一段内容,如果觉得不合适,还可以再让AI帮写。
结果勉勉强强(说的像人话了,但离专业又远了一些),但也离不开人类这个「生物智能体」的介入,也需要在用的过程中,不断调教,封闭成自己的skills库。
使用ima的过程中,得到了不少同学的启发与教导,在此感谢@同学们。
本站文章均为手工撰写未经允许谢绝转载:
夜雨聆风 »
Ima知识库应用的几点分享