
前几天写了一点关于ai的感想说一点关于文史学者使用 ai 的看法。那么在实操方面,一个文史学者可以如何使用ai?本文所谓 ai,指以gpt、deepseek等为代表的语言大模型和以之为基础展开的多模态ai。以下所论仅截止于2026年3月31日。
目录
1.目前ai的常见使用方式
2.目前文史领域ai的局限
3.什么是ai知识库?
4.什么是ima?
5.为什么推荐ima?
6.ima知识库的局限
7.ima下载使用方式
1.目前ai的常见使用方式
目前来看,最基础也最常用的做法,是用ai翻译和润色词句,任何一个大模型都可以做到且做得很好。一些重复性的、格式性的文本劳动,也可以由ai完成。
ai在文献学和计量史学上提供了一些高效工具,其本质是降低了码代码的门槛。如果要进行体量较大的文献学处理或者进行数字人文研究,那么使用ai可以提升不少效率。不过这更像是少部分人的需求,大多数文史学者没有兴趣和时间精力花费在这类工具的专门打造上。
而对于大部分文史(应该也可以包括哲学)学者来说,最想使用ai进行辅助的操作至少包括以下两方面:
①希望ai在文献综述和模糊检索上,为论文写作提供基本参考;
②使用ai进行文本分析和史料解读,以便快速浏览大量文献并进行头脑风暴。
可能会有人想尝试直接用ai撰写论文初稿,但这也必须建立在前两步的基础上。
2.目前文史领域ai的局限
要完成这两步,目前ai尚有如下局限:
①一般ai是为对话而设计,其语言模式不符合长篇论文写作规范,倒是更像一篇大纲。
②ai在文本分析和史料解读上十分幼态和平庸,我认为它的水平暂时停留在中学生阶段。
③ai可能在文本总结上略有优势,但这也导致它的很多“高论”其实都是抄的前人成果而不给出处,让人抄袭而不自知。
④未经定制的ai,资料和知识来源良莠不齐,缺乏精确性和深度。如果让ai进行文献综述和模糊检索,需要你提供一个个人专用的、针对性极强的知识库。
要解决问题①,即用ai直接生成论文,需要专门设计过的ai工具。这方面外国比较有名的有Paperpal (paperpal.com),它们在国内基本无法使用,就算可以,这些工具要么不擅长中文写作,要么论文库都是理工类或者英文,缺少中文研究成果。国内这类工具,同样强于理工社科而弱于文史哲领域,最终成果不超过本科生水平。我想,用ai直接生成论文,目前并不成熟,想必有追求的学者也不会这么做。
对于问题②,应该说是目前ai真正的硬伤,使用再多的工具进行优化也没什么本质改变。它的解读带有统计学上平均主义的缺点,可以成为文本翻译和总结的助手,但是很难从中挖掘出问题。这方面目前依旧是文史哲学者的护城河(至少目前是)。
因此,总结下来,文史哲学者使用ai,目前最好的用途除了翻译和润色词句外,就是文献综述、模糊检索和头脑风暴了。而它们面对的③④两个问题,就需要通过“知识库”的方式解决。
3.什么是ai知识库?
ai在回答一个问题的时候,会调动两种文献资源:一种是预训练资源,就是在制造ai模型的时候用于训练的数据库;一种是ai模型完成后,实时检索资料来回答问题。对于学者个人而言,需要用到的是后者。ai回答你的问题时所能检索的资源,决定了它的精度和深度。
一般ai在回答时,会连接网络进行检索,例如专门的中文学术检索ai秘塔,就会通过关键词,检索万方上的论文来回答你的问题。另一种则需要你上传一个pdf文件给ai,ai会就着该文件中的内容来回答你的提问。
所谓“知识库”,就是你将一堆pdf等文件传给ai,ai在回答问题时,不是漫无目的地网络搜索,也不是认准一个pdf,而是根据你的问题,智能检索你上传的所有文件,从中提取有关信息,回答你的问题。
这类工具实现起来并不困难,目前国外最流行的软件是NotebookLM,在国内不方便使用,国内可以用腾讯ima。
4.什么是ima?
ima首先是一个类似豆包这样的ai软件,集成了deepseek、智谱GLM和腾讯混元三个大模型的最新版本,可以像使用豆包一样直接提问,它会检索网络文章回答问题(免费)。这是最基础的用法:

其次,ima提供了免费的知识库功能。你可以在ima的知识库中上传你搜集的各种论文和著作pdf,它会自动OCR并提取内容。当你在知识库里提问时,它会利用你上传的论文回答问题,而不是全网搜索。

由于ima知识库使用极其方便,只需要下载ima软件即可,并且全程免费,因此本文极力推荐一般文史学者使用它。下载方式见文末。
5.为什么推荐ima?
ima知识库有几个亮点:
①知识库分为个人和共享两种,前者提供免费空间30G用于存储pdf,后者提供免费空间50G。个人知识库仅自己可见,共享则可选择共享程度(完全公开;仅好友共享)。
②知识库可以上传pdf,也可以直接输入网址导入网页(包括微信公众号文章)。pdf可以选择完全公开,别人可下载,也可以利用其中的内容问答;也可选择不公开,别人只能看到书名并进行内容问答,但无法下载pdf,以保证版权和隐私。
③知识库可进行文件夹分层,在不同文件夹提问,ai利用的资源仅限于该文件夹。
④知识库会自动OCR文件,所以即使是影印pdf也没有关系。
⑤知识库问答也可以选择deepseek、智谱GLM和腾讯混元三个大模型的最新版本中的任意一个,免费。
⑥知识库在回答时,会标注文献出处,点击脚注即可自动跳至对应pdf的对应页码,还会将相关段落高亮标注。
⑦如果你上传的是英文等外文文献,在知识库中点击打开后,可以直接进行对照翻译(不过翻译所用的ai模型无法选择,似乎是混元):

⑦在共享知识库中,你可以订阅并加入别人分享的知识库:

我曾贡献一个知识库,里面存了“天算与经学”公众号所有历史文章,还有我自己收藏的中国天文学史相关论著pdf:
「天算与经学」专属 DeepSeek AI 客服上线,24小时解答您的问题
下面提供一个我的知识库ai问答案例:

你可以进行多轮对话,让ai对你提供的知识库进行文献总结、知识点挖掘、查询前人研究成果中对某个问题的看法,也可以通过对话进行头脑风暴,让ai提供意见。
6.ima知识库的局限
当然,它也存在一些问题,值得注意的有:
①它受到ai模型上下文长度的限制,如果ai模型如deepseek最长只能记忆100万词元token,而你在知识库上传了几百万字的文献,虽然它会使用rag技术,每次只检索和调用部分内容,但影印pdf和超长内容依旧会影响其精确性,很容易出现ai读了前面忘记后面,只能读取一部分文献的现象。所以最好进行文件夹分层,每个文件夹里的文献不要过多。
②你的知识库的品味决定了ai的品味。如果你没有提前搜集较为完整的某领域针对性的文献pdf,前期工作最好还是直接用一般的网络检索,或者用专门的学术检索ai如秘塔,效果会更好一点。
③提问方式也很重要,不同的问法会有完全不同的回答,可以多换一些方式提问,也可以尝试对文件进行文件夹分层,让知识库更精确化。
④它并不会标注每一个观点的出处,对于没有出处的观点,引用需要谨慎。
⑤如果你要公开分享知识库,请注意pdf文献的版权问题,最好不要开放下载。
⑥ai始终只是辅助工具,提供查询和参考。直接生成的论文,要小心使用,因为大概率只是前人文字的拼贴组合。
7.ima下载使用方式
官方公众号:
官网链接:
https://ima.qq.com/download

↑ 点击加入“天算与经学” ima 知识库
暂时只能想到这么多,有更新会在留言区发布。
欢迎在留言区分享使用经验!
喜欢的话欢迎赞赏,感谢支持~
夜雨聆风