Ima知识库应用的几点分享

0、引言

简单回溯下我使用ima的过程，形成了阶段性的总结文档（简单类比封装成openclaw的skills）

1）IMA是什么？

ima官方知识号总结得很好。

①腾讯出的，用的deepseek和腾讯自己的模型（差点意思，但由于知识库使用的是RAG压缩生成而不是大模型的tokens概率生成，差一点也能接受）；

②知识库，你自己的数据资产，可以交给他管理，目前市面上我还没有发现比IMA更好交互的管理工具；

这点很重要，相比于豆包等通用大模型，ima具有长期的资产可积累性，更利于团队共享协作，降低幻觉（仅基于你的知识库执行任务），免费（flomo浮墨笔记软件一年会员费近百元）。缺点就是内嵌模型跟国际领先SOTA比起来，差得不是一点半点。

2）IMA能干什么？

IMA官方知识库给了我很好的提示。三类场景：专业服务、团队协作、个人学习；三类核心功能：知识库管理、问答、创作。

1、知识库管理

1）数据类目

以下是ima官方给的指引，大体是这些，但过于泛化了，不太具有针对性。

我自己理解起来有这样几类数据：

① 政策法规及行业标准规范

② 精品论文或公众号文章

③ 上市公司财报

④ 项目与研究案例

⑤ 个人工作非敏感文件

⑥ 其他

这个其他，涉及到一些语音、视频类的资料，转化为可读性更强、文件空间更小的文本、图像资料，那首先第一步是要去各种网站上把语音、视频类的资料donwnload下来。

a.电子书籍，使用zlibary镜像网站：

b.抖音短视频，复制链接→发送给豆包→提取文案；

c.视频号短视频，转发给元宝好友→提取文案；

d.抖音长视频，使用Parsevideo下载→上传至通义听悟→提取方案

e.视频号长视频，使用GitHub工具wechatVideoDownload下载→上传至通义听悟→提取方案

网盘下载链接：https://pan.quark.cn/s/02054d6f9664

f.播客，在chrome或edge浏览器安装cosmos enhanced插件→复制小宇宙APP的播客音频链接→若文件≤200M，将音频上传至ima解析；若＞200M，上传至通义听悟→提取方案。

cosmos enhanced链接：

以下是我个人的知识库一级类目，没有系统去梳理过，偏随意。

数据资产的来源主要为以下几类，重点是可动态更新：

① 知识广场其他知识号转存：如上截图中红框处；

② 微信聊天、微信收藏、公众号或浏览器文章转存；如果是浏览器，需要安装下ima的插件；

③ 个人文件或文件夹批量上传；这里最好是能够上网的数据，单位的一些敏感数据，最好慎重。

④ 笔记或问答结果转存；有些与AI交互的精华可以转存到笔记中，单个笔记支持上百万文字，如下：

⑤ 录音纪要或录音上传；这点是很好用的，比如我们去参加行业的会议、培训会、项目专家会或者领导甲方讲话，都可以录音，放进去，形成知识库素材，如下截图：

2）tips

AI工具能提高效率，是种诱惑，但个人也要注意采取一定的措施；简单假设ima属于腾讯大厂的，不太能把用户的隐私出卖，但始终还是要注意。

以下是ima官方知识号给出的建议：

官方说的这些，都挺好的，需要一一对照检查。

我自己的使用体验：

一是不要以为ima知识库内的文件设置为「不可查看」就以为万事大吉了，如果知识库分享出去，别人可以看到你知识库的文件名、AI摘要，然后通过「提示词」可以逆向工程把你的内容用ima导出来；

二是涉及个人数据（比如体检报告、私人笔记）或单位数据（比如工作文档），放在「个人知识库」中，不要放入「共享知识库」中，更不要发布到「知识广场」上。

2、问答与搜索

1）应用场景

以下是ima官方给的应用场景。

我自己觉得「查询」应用场景有几类：

① 标准库的知识；比如某个规范、某条政策、某类规划案例的查询；

② 某某大佬的某个观点，我们印象中大佬讲过，知识库里面也有相关资料，比如录音，则可以问ima原文是什么、出处在哪里；

③ 某份excel、报告或数据库中的数据。

2）tips

以下是ima官方给出的指引：

这个涉及到「提示词」，也就是AI交互了，是一门大学问，一时半会儿说不完，我还在学习，在这里也不赘述了。大体记录几个tips：

① 打标签；对部分重要的数据文件，可以打上「#标签」，这样可以针对某标签提问，针对性更强，因为模型不是万能的，如果知识库文件太多，有可能超过了模型的检索能力边界，导致找不出来，所以我们如果能够准确缩小范围，对于结果应该是有用的。

② 分场景提问；需要个人对知识库的内容较为熟悉，知道你所要问的问题，大体在哪里。可以基于「标签」提问，可以基于「知识库」提问，也可以基于「文件夹」提问，甚至可以基于单个文件提问，用多了，自然就知道了。

③ 精华问答即时转存至笔记；这点很容易忽略，因为在上千个文件的知识库中提问，当你想回溯你之前的问题或者接着提问的时候，你很难记得住你曾经在那个文件夹或文件里面提过问题了，这个时候，你找笔记是最好的，而笔记，反过来，又可以加入知识库，形成你的知识素材。

④ 不要完全相信ima给的数据或回答；要去核实下，头脑中对ima给的结果如果有一丝的怀疑，都要点进「引用文献」去核实数据来源。

⑤ 个人需要有对模型能力的判断力；有时候，可以用ima去问然后自己去核查；也可以调用gemini等更强的通用模型去问，也许会有意想不到的结果。

比如问京沪高铁历年的业绩数据：

ima的结果如下，居然没有2021年的数据，不科学，这时候只能自己去查ima中的2021年的财报：

而gemini结果如下，跟ima给的数据是对得上的，多了某年份的背景信息，也补齐了2021年的数据：

gemini甚至还给出的具体的上下文解释，如下截图：

因此，在这种「非私有化数据」的场景下，通用大模型能力更强。

那为什么我还是在知识库中丢了「交通行业上市公司财报」的数据资源呐，直接问gemini3不就好了吗？我自己想的是，上市公司财报是高质量的数据资产，里面不仅有经营数据，更有某些细分的行业的发展趋势，是管理层那帮大佬一年一度写出来的，是值得我们个人的知识库作为高质量数据源进行引用的，另外一点，我反正先把我的知识库数据资产建立起来，ima的模型能力将来某一天会升级的，当模型也变得厉害的时候，有可能会生成不一样的、更好的东西，交给时间。

3、内容创作与协作

1）生成PPT

不适用。

目前生成的PPT字太多，字过小，图太少，不太美观，更像是对外发布的报告，而不符合PPT阅读习惯；生成时间过长，32页PPT，耗时近1小时14分钟，着急的时候，只能干着急。

2）生成报告

这个功能我应用相对多一些，可以生成整体报告（还可以用任务模式-深度报告），也可以生成几段话（创作或修改），可以在笔记里面生成内容。

写个人总结可以用，写标书可以用，写论文其实也可以用。

关键是要喂给模型合适的「知识」，这就是第一步里面的「知识库管理」的内容，是一个长期迭代积累的过程。

3）生成播客

如果没做自媒体，用处不是很大，但这个功能其实ima做得还不错，语音较为真实。

4）生成流程图

这个功能比较适用。可以基于知识库的单个文件进行「总结内容」，转存到笔记里面，根据自己的理解进行内容调整与修改，再针对笔记生成「流程图」，流程图可以导出图片，也可以导入到xmind软件里面再创作「如换主题、改内容或持续更新内容」。

很棒的功能。

5）分享

这个功能也比较适用。自己写的笔记可以导出为PDF文档，分享与人；知识库生成的内容也可以按「长图」模式分享与人。

也可以添加管理员，一帮人一起建知识库。

6）tips

以下是ima官方给出的该场景下的应用注意事项。

这个功能我使用得较多，我个人觉得主要有几点：

① AI意识。拿到一个活，先想一想，AI有没有可能帮我，知识库有没有可能帮我先理一下，比如去年写一个院内课题申请的报告，时间比较紧，我就想用AI帮我写，首先是喂资料，我把知网上相关的「核心期刊」论文、院内相关的报告（可上网的那些）、搜一搜出来的相关的公众号文章，喂给IMA，然后整体写一个。不行，但可以提供思路，拓展思维；然后我会结合领导的想法及自己的思考，理一个简单的框架（这一步，AI目前只能是辅助，就跟AI做PPT一样，可以自动生成，但效果不理想），然后分别再逐段找IMA帮我写。

为什么不用通用大模型，是因为那些写出来的东西，太空，太泛，很可能更不好用，如果把自己的内容喂给通用大模型比如gemini让它去写，写出来的质量也许要好一些，但麻烦，知识库管理远不如ima来得好。

② 找应用场景。学ima的技能，是死的知识，很简单，有个技术文档即可，或者看别人的帖子即可，一抓一大把，但更为关键的，是要找到自己的应用场景，一步步真地去用，去迭代自己的技能，这样才能更好地与AI交互。比如，对我来讲，比较适用的一个技能，好比我有个框架，把一些相关资料给ima帮我写了个初稿，然后我去找甲方或者专家汇报，汇报过程中我会做PPT，也会在汇报的时候用IMA录音，回来后，我就可以结合领导的要求或自己的新想法写提示词，基于录音或汇报文件，让IMA再帮我重新修改报告，这是很适用的，它能够将那些以前的「祼数据」用活，要在以前，可能专家会也会录音，但录了也就永远躺在手机里面了，也不会去看它，还占用内存，而现在，ima录音可以自动生成纪要、可以自动转文字方便我位拉着看或者查询某位领导讲了什么话，也可以基于ima录音进行干次创作，这个小小的场景，就把工作流都与AI能力结合起来了。

③ 去掉AI味。AI目前我觉得还是以辅助为主的，因为它没有人类的「社交、工作、生活」等等「上下文」，哪怕openclaw，也只能局部的上下文，所以，AI还做不了80%的数字分身，这是输入端；而过程端，IMA的模型能力还不强，还存在幻觉，当然只可以等着模型升级，但我们还是要先用起来，IMA写的东西，跟notebooklm好像差不太多，但相比gemini3 pro来讲，我觉得「人味」要少，它喜欢制作一些双引号括起来的新概念，喜欢在段落里面打些冒号，喜欢写一些大词空词，这些，我们都没有办法在当前阶段直接把「AI生成的报告」直接交出去，而是要借助AI的部分能力，融入到我们的工作流中去，提升效率。

对于这一点感触，有点类似于我在学习研究AI生成PPT的最终结论一样，AI只是提供思路，辅助框架，做素材，但最后进行「系统集成」的那个，还是我们这个「拥有足够多的上下文」的人类生物智能体。

4、应用实例

1）使用ima查阅财报中的行业信息

以下是ima回答的结果，我转存到笔记「0-临时」中，就可以分享成长图了：

之后，可以让ima对文件夹或者单个文件进行总结，画脑图，辅助我们认识整体这个文件素材的概要，以便于提问。

然后，每个人就可以发挥自己的主动性，在好奇心的驱使下，与AI进行对话了。可以让IMA给你出问题、优化提示词，也可以你反驳他的答案让其重做，比较简单，不演示了。

2）使用ima进行写作

step1.使用「任务模式」生成报告，会花点时间。

step2.ima写出来的文章，AI味太深厚（是我提示词的原因），将文章转存为ima笔记，如下截图：

step3.ima写出来的文章，还有有点生硬（我提示词的原因），采用ima的帮写功能（实际上，我自己的习惯，我会让gemini3 pro也写一篇，然后导入ima笔记，再让ima的AI在帮写），如下截图：

生成的结果，好了不少。

step4.然后针对其中某一段内容，如果觉得不合适，还可以再让AI帮写。

结果勉勉强强（说的像人话了，但离专业又远了一些），但也离不开人类这个「生物智能体」的介入，也需要在用的过程中，不断调教，封闭成自己的skills库。

使用ima的过程中，得到了不少同学的启发与教导，在此感谢@同学们。

Ima知识库应用的几点分享

Ima知识库应用的几点分享

0、引言

1）IMA是什么？

2）IMA能干什么？

1、知识库管理

1）数据类目

2）tips

2、问答与搜索

1）应用场景

2）tips

3、内容创作与协作

1）生成PPT

2）生成报告

3）生成播客

4）生成流程图

5）分享

6）tips

4、应用实例

1）使用ima查阅财报中的行业信息

2）使用ima进行写作

wang

猜你喜欢

评论抢沙发

Ima知识库应用的几点分享

0、引言

1）IMA是什么？

2）IMA能干什么？

1、知识库管理

1）数据类目

2）tips

2、问答与搜索

1）应用场景

2）tips

3、内容创作与协作

1）生成PPT

2）生成报告

3）生成播客

4）生成流程图

5）分享

6）tips

4、应用实例

1）使用ima查阅财报中的行业信息

2）使用ima进行写作

wang

猜你喜欢

评论 抢沙发

评论抢沙发