乐于分享
好东西不私藏

聊聊学术AI工具

聊聊学术AI工具

从去年下半年开始,我们陆陆续续联系试用了不少学术AI工具,包括爱记的LeapSpace、WOS、CNKI、超星、万方和玻尔等厂商的产品,我趁机按自己并不科学的方式测试了一遍。记得当时发了个朋友圈,用不同类型的饭店来类比不同的产品感受,从米其林到路边摊一一对应,但很快就删了,一个是都是朋友不好意思差评,再一个AI发展太快,当时的看法转头就会被迅速打脸。

最近呢,新学期开始,友商们纷纷上门拜访,都想问问我对他们AI产品的看法,我觉得还是按我的想法写写吧,都是基于自己技术追踪与业务身份交汇形成的一些零散的想法,不成体系也没啥逻辑,供朋友们批判,欢迎留言交流。

再说现在AI相关的东西,哪有确定性啊,我这次说的也会很快过时,有思想准备。

那么对学术AI工具来说

1

具备什么基础条件最重要?

去年我认为学术AI产品最终比的还是数据。现在我想再加上一句,任何AI产品最终比的都是算力。

其实也不算矛盾,数据是学术AI产品的最底线,算力则是学术AI产品的生死线,都是对同一个事物的不同角度的看法。

从用户选择学术AI产品的角度,比较大模型基座的能力只是基本的起步,最重要的还是数据,要么这个产品自身拥有最多的独有的学术数据,要么能够买来最新的最全的学术数据,要么拥有极其开放的平台支持接入多来源多类型的学术数据。单纯的AI能力不是最重要的,几乎每天都有新的模型超越旧的模型。只要不是垃圾模型,用户看的还是数据,包括训练的、LORA的、甚至RAG的。因为学术成果使用的数据,不仅要求准确性,更要求权威性,数据不全就是成果不全,数据不权威就是成果不权威,论文可是要在全球科学共同体被检验的,只有自有的、只有开源的、或者只有本语种的学术数据,写的东西怎么可能上CNS呢?

从学术AI产品发展的角度,发展到一定程度比的就是算力了,大家现在都知道token如何费钱了,对于AI应用来说,多服务一个客户可能就意味着要多加一张GPU多用一度电,要不为啥英伟达市值一度突破五万亿、存储产品价格翻番无货、巨头们都要自己建发电厂了呢?为了算力逼得Anthropic要用朝三暮四的方法调整Claude Code的额度,逼得Musk延后火星计划也要先在太空建数据中心,昨晚DeepSeek服务大崩溃也许也是因为算力突破了极限。

算力不是随便哪个学术服务商都能自己堆积设备解决的,一些规模小的公司恐怕更无力承担,说到底就是有没有钱可以烧,都需要购买商业算力才能提供稳定的服务,这也是上一篇文章我说学术AI服务必将变成token商业模式的原因。

2

现在什么模式界面最重要?

目前大体来说有两种学术AI界面,一个是采用通用AI的对话框模式,一个是采用功能模块堆积的商店模式。

我个人倾向于越简洁越好,一个是减少了我个人选择的次数(用你是因为你省事儿啊),一个是证明了产品有智能决策的能力(用你是因为你懂事儿啊)。

那种满屏功能入口和选择按钮的(还包括动不动跳出来的收费窗口),对我这个选择困难症来说,真的是巨大的负担。既然AI了,一个对话框除了可以交互获得答案,更应该可以直接下命令啊,安排你根据我以往的学术研究记录和使用交互历史,智能地替我完成一些选择性的操作不过分吧,别让我再去选这选那。最好我写一个研究课题提一些自己的想法加一些实验数据交给你,过几天就能收到审稿意见了,中间过程全替我干了更好,哈哈。

当然,这不是个好想法,目前这就是个悖论,出版商不愿意让你用AI撰写学术论文,但是还不得不争相提供AI帮你写论文,AI辅助学术一旦失去边界,极易沦为生产学术垃圾的流水线,所以AI既是矛也是盾,如何在提供生成能力的同时维持学术原创性的权威底线,是对学术AI工具们最大的考验。造成这个矛盾的原因也很简单,就是现在的学术出版模式落后啦。未来论文这个形式大概都没了,科学交流主要是在AI之间进行的,人只是贡献创意的碳基生物和做实验的劳动力。(科研范式的革命?不,是颠覆

总之就是,做学术AI产品不能再用传统的软件工具和SAAS平台的那种开发设计思维了,得有新思路,可能就包括下面我的一些想法。

3

将来哪个发展方向最重要?

在唯一全能的GeminiX统治全球学术圈之前,最近几年内,我猜着,学术服务会随着AI应用技术的发展和算力经济的蔓延,从全文下载服务模式转换到知识服务模式,入口也会从机构统一服务变成个性化的随身学术工具,Big Deal也会逐渐混合token结算。

是的你想的没错,这么说确实是因为最近感受到了Openclaw的迅猛冲击。

Openclaw类的应用模式,并不是大模型能力有飞跃,而是从AI对话发展到了智能执行,已经有很多文章介绍它我就不多说了。它之所以成为现象级应用肯定是因为符合了某种需求(现在变味了,成了商家争抢的流量入口和变现手段)。学术研究也一样,如果一个学术工具可以从单纯的交互对话,发展到可以操作文件修改论文整理数据选刊投稿收发邮件缴费发表都能漂亮的完成,我会毫不犹豫的转向它,不是不可能啊,今天看新闻VISA已经提供CLI模式的服务接口了,“龙虾晚上不休息是因为忙着花你的钱”不是笑话了。

所以,学术AI工具下一步是不是应该考虑发展Agent使用的模式,提供CLI、API、JSON、MCP和Skills等AI友好的界面?这个需要提前布局,因为做到这一点并不是现在的模式加点东西就可以了,设计思维和服务模式都要有彻底的转变。

人类友好讲究的是界面可见性、可理解以及交互舒适度。AI友好需要的则是操作有效率、有状态、可诊断、可组合。比如AI友好的API就不是简单的交换数据,而是要迅速提供答案,人类界面需要让我看到和理解每一步操作,而Agent不需要,它要的是高效全量的数据流动。万一出错,Agent不需要简单的错误返回,而是要告诉它错了以后下一步往哪里走,维持流程性。还有就是要给Agent提供回溯和记忆能力,可以迅速返回正确走向和避免记忆偏离。将来数据商的学术AI产品如果AI友好这个能力很差,即使有海量的数据,也会在无休止的大量token往复浪费中耗尽算力,无法高效准确反映学术能力。

还有一个应该关注的方向,就是个性化,其实就是养成性,这段时间我自己用了Openclaw以后感受很深,前面也写过。虽然现在的学术AI工具大都可以保留对话记录,但并没有全局的长期记忆,每次提问可能都要重新设定背景,不能长期跟踪我的思维路径、记录我的灵感闪现。“随身学术龙虾”这种模式就可以,这种不可迁移的养成记录就是一种个体的学术思维镜像,就会让人对产品产生致命的黏性,这应该是厂商最理想的用户群体吧。

另外,在没有建立信任之前,研究人员可能并不希望自己的独家创新思路被出版商随便用于数据训练,现有的学术AI工具有的已经明确了不使用用户数据有的没有明确,所以能否本地化、做到企业级的数据隔离与权益保护,应该也是知识服务商需要关注的方向之一吧。

今天有公司来说他们的产品已经全面转向开发学术AI智能体,符合将来的发展方向。不过,结论别下这么早,我现在已经不信还有什么确定性了。

截止到目前大家普遍认为,Prompt工程解决了提问质量的问题,Content工程解决了长一致性问题,这两天热传的Harness工程可以解决智能体的可靠性问题,这不挺好嘛,挺有确定性的,Anthropic就是这么认为的,但是OpenAI立刻跳出来不这么认为,Codex的负责人Michael说,AI时代,能真正改变研究范式的到底是大模型本身,还是围绕模型构建的Harness?他的答案还是大模型。假如Anthropic是对的,那么未来竞争的将是不同的智能体框架,假如OpenAI是对的,未来竞争的仍将是基座大模型的能力。

什么时候做选择都是有难度的,包括图书馆,好在大家都一样,都不确定。

要不友商们在决定发展方向之前,先给我们大家的Openclaw写个官方的skills用吧,这个目前绝对流行,我绝对先用。

4

前几天我在群里说,我想推给师生用的学术AI工具,生态应该是开放的,资源应该是多方的,技术应该是开源的,能力应该是无限的,安全应该是自控的,迁移应该是自由的,数据应该是本地的,算力应该是免费的。

接着就收到了群主直接而又委婉的批评,正是因为我们这种使劲薅羊毛的想法才把羊都薅死了,好企业都活不下去了,你看看现在给学校做信息化的都剩些啥啊。

呵呵,其实作为老技术人我也是深有同感的,哪有这么理想的工具啊,什么好处都让我们占了。其实我只不过是希望说得夸张些,让厂商可以多考虑考虑用户的想法,我们可以花钱购买服务,但希望我们有限的资金能为读者提供尽可能完善的工具。

不管学术工具如何发展,不管社会环境如何变化,我们图书馆对它的读者来说,应该永远是一个智慧的、免费的、有用的好伙伴。

欢迎关注“后图书馆现场”

一个老馆员的碎碎念