如今,“AI+药物发现”已经成为科研热点。但对于民族植物学研究者来说,一个更现实的问题是:AI到底能参与哪一步?它会替代田野调查吗?会替代植物分类吗?还是仅仅帮助分析数据?
最近发表的一篇关于喜马拉雅药用植物的综述,尝试梳理出一条较完整的研究路线:如何把民族植物学、植物化学、多组学和人工智能连接起来,让传统知识真正走向现代药物发现。这篇论文提供了一条值得民族植物学借鉴的方法路线。
一、AI之前,人类先完成什么?
很多人一谈AI,就认为机器可以自动发现规律。如果按这篇综述的逻辑来看,AI介入之前,首先需要的是民族植物学知识和传统医药资料的系统整理。
论文所依赖的知识基础包括已有民族植物学研究、传统医药文献、药用植物分类与分布资料,以及TKDL、IMPPAT、AYUSH Research Portal等印度AYUSH传统医学体系数据库。也就是说,AI并不会自己发现传统知识,它首先需要民族植物学把知识整理成数据。如果没有长期积累的访谈资料、药方记录、植物标本和传统知识数据库,再先进的算法也无从学习。
这一点对民族植物学尤其重要。未来真正有价值的,不只是发表论文,而是建立能够不断积累、不断更新、能够被AI利用的知识数据库。
二、AI可以参与哪些环节?
论文介绍了很多AI技术,例如植物识别、QSAR、分子对接、虚拟筛选、ADMET预测等,看起来概念很多,其实可以归纳成一句话:
在作者提出的框架中,AI主要用于在大量候选对象中,帮助研究者更快找到最值得研究的对象。
传统天然药物研究通常遵循这样的路径:
民间调查 → 植物采集 → 成分分析 → 药理实验 → 药物开发
而论文提出的路线则是:
民族植物学知识整理→植物鉴定与数字化识别→活性成分提取与分析→多组学数据整合→ AI建模预测→虚拟筛选与药物性质评估→实验验证→天然药物开发。
相比传统模式,AI的重要作用之一不是替代实验,而是在进入实验之前缩小候选范围,提高研究效率。打个比方,过去面对大量候选植物时,研究者可能需要逐一筛查;而AI可以先帮助预测哪些对象更有潜力,再把实验资源集中到更小的候选范围上。
三、AI不仅识别植物,更分析植物为什么有效
论文介绍,目前深度学习模型已经可以辅助植物图像识别,例如利用叶片、花或果实照片进行自动分类。但文章进一步强调,AI的价值不止于识别植物,还在于帮助解释植物为什么可能具有药用价值。
论文重点介绍了多组学整合,包括基因组(Genome)、转录组(Transcriptome)、蛋白组(Proteome)和代谢组(Metabolome)。AI可以综合分析这些数据,寻找控制次生代谢物合成的重要基因和酶,并推断相关生物合成途径。
也就是说,研究重点开始从“植物有什么成分”,逐渐转向“植物为什么会产生这些成分”。
四、AI如何帮助天然药物发现?
论文综述了AI在天然药物研发多个环节中的潜在应用,包括QSAR(定量构效关系)分析、分子对接(Molecular Docking)、虚拟筛选(Virtual Screening)、ADMET预测,以及多成分、多靶点网络分析。这些术语听起来很复杂,但核心目标其实一致:减少试错。
对于传统草药而言,一个植物往往包含几十甚至上百种化合物。如果完全依靠实验逐一验证,不仅耗时,而且成本极高。AI能够提前预测哪些化合物更值得研究,从而提高后续实验效率。因此,AI并不是替代实验,而是帮助实验设计得更加精准。
五、对民族植物学有什么启发?
我认为,这篇综述最大的启发,不在于介绍AI算法,而在于提供了一种可以迁移到民族植物学的方法框架。
如果对应到民族植物学研究,大致可以分成三个步骤。第一,建立结构化知识库,将访谈资料、地方志、药方、市场调查等信息整理成规范的数据,而不仅仅停留在文字描述。第二,为每个植物设计可量化特征,例如使用频率、分布范围、文献记录数量、市场利用情况、已知化学成分以及已有药理研究等。第三,与数据科学家合作开展AI分析,利用机器学习预测哪些植物最值得进一步调查、保护或开发,并分析影响判断的关键因素。
整个过程中,AI不会替代民族植物学,而是把民族植物学积累的大量知识转化为可以计算、比较和解释的数据。
六、AI不是万能钥匙:三个边界必须讲清
综述中比较值得肯定的一点,是作者并没有把AI写成万能工具。相反,他们花了不少篇幅讨论数据偏倚、验证不足和伦理问题。
第一是数据问题。许多AI模型依赖公开数据库,而喜马拉雅地区的特有植物、稀有植物和高海拔植物数据并不充分。如果训练数据本身偏向那些研究较多的物种,模型对地方性物种的预测就可能失准。
第二是传统知识的复杂性。地方名、分类方式、用法描述和疗效判断往往具有语境性,不同社区、不同语言和不同记录者之间可能存在差异。把这些资料直接丢进模型,并不会自动变成科学证据,反而可能放大错误。
第三是验证和伦理。AI预测出的活性、靶点或药物潜力,在没有体外、体内或临床证据前都只能算假说。同时,传统知识数字化还涉及知识产权、事先知情同意、惠益分享和生物资源利用等问题。AI越能提高知识转化效率,越需要把这些规则讲清楚。
民族植物学提供知识源,AI负责缩小搜索空间,现代实验完成最终验证。三者结合,才可能更稳妥地推动天然药物发现。
备注:需要注意的是,这篇文章是一篇综述,并没有训练新的AI模型,也没有提供一套可完全复现的计算实验流程;它的价值主要在于把已有研究和未来方法路线整合到同一个框架中(图1)。

图1 该综述的主要内容摘要
参考文献:
Kour, Divjot, et al. Synergizing ethnobotany and artificial intelligence: exploring therapeutic frontier of Himalayan medicinal plants. Environmental Sciences Europe (2026). In press.
夜雨聆风