乐于分享
好东西不私藏

别再让 AI 傻读文档!我用半自动化方案,语料利用率提升 50 倍

别再让 AI 傻读文档!我用半自动化方案,语料利用率提升 50 倍

维度哥随笔

前两天采集了1500多篇的文章,语料是已经到手了。没有看过语料重要性的小伙伴可以看一下我之前写的文章。

那现在出了一个问题,就是如果我直接把这个语料给到龙虾的话,龙虾需要消耗大量的时间、Token以及算力去读取这1000多篇的文章。

对它来说,或者对我来说,这些都是不划算的。所以我找到了ima知识库,这时候,ima知识库也开放了API接口,给龙虾去调用。不管是国产的还是原版的,都可以用ima知识库开放的Skills去给你的龙虾安装,然后你就可以用龙虾调转你的知识库的内容了。

但是我在做的时候遇到了一个问题,就是ima知识库,它只允许龙虾去读取这1000多篇文章的标题,龙虾是没有权限读取到文档本身里面内容的,这就造成了一个问题,如果我给了龙虾一个选题,龙虾只能在这1000多篇的标题里面去找相关内容。但是如果作者没有在标题里面出现这个关键词,而是在正文里面出现了,这就会错失很大的机会,造成语料的很大浪费。

所以验证过了之后,我就把这个问题抛回给了我的龙虾。

龙虾给我了三个解决方案,我看了一下,只有用第三个方案,也就是半自动化的方案,也就是我把选题给龙虾,龙虾出提示词去问知识库。知识库给了完整的语料回答,再把内容复制给龙虾。

结果我做了之后,我发现知识库是真的牛,因为它可以无限次提问,它可以一下子抓取160多篇的文章内容给我的龙虾。而我的龙虾如果仅按标题去搜索的话,只能搜索到3篇的内容。龙虾自己也在夸,说这个语料给的就是天差地别,产出的内容肯定也是不一样的。

所以这个小小的经验也分享给大家。这样子的话能够用最低的成本干出最大化的效果。

这样本地的龙虾就不用花算力、花时间去挨个读这1000多篇文章了,很耗时间。把这部分的工作量交给一个免费的知识库,而且它不需要算力,也不会联网搜索,只会根据我的知识库去出语料。而这部分语料也是最精准的内容,会给到龙虾,推荐大家去试一试这样的组合。

维度哥 本人微信 97009725 查看朋友圈和领取副业资料包。

—End—

*推荐阅读
1、维度哥的自我介绍
2、软件文章CPS变现项目介绍
3、白嫖一个月多模型视频生成会员

永久免费星球⬇️

欢迎点赞,转发给我支持~
👇👇关注我👇👇
陪你一起副业成长