基于多源异质网络数据集搭建中医药检索App


在中医药现代化领域,网络药理学是衔接传统本草理论与现代分子生物学的核心技术手段,能够系统阐释中药“药材-成分-靶点-疾病”的作用机制,产出了大量标准化研究成果。但在实际应用与科研落地过程中,行业普遍存在数据零散、检索单一、资源混淆等痛点,极大限制了成果落地效率:
1.数据资源分散:中药数据库、药典数据库、症状数据库、靶点数据库相互独立,用户与科普人员需多平台交叉检索,操作繁琐、耗时费力;
2.检索维度单一:传统中医药工具仅支持“药材查功效、药材查疾病”的正向检索,无法通过症状、疾病、核心致病基因反向溯源匹配本草资源,难以适配中西医结合的应用场景。
针对以上痛点,本项目依托2024年Dryad平台开源的《TCM异质网络完整数据集》(DOI:10.1016/j.dib.2024.110962),整合HIT2、《中华人民共和国药典》、SemMedDB、STRING等多源权威标准化数据,基于Streamlit轻量化Web框架,开发了一款多维度智能中医药检索App。平台支持症状检索、疾病检索、核心基因靶点检索三大输入模式,可自动对匹配结果分类分层,精准输出药食同源、保健品类、药用方剂三类中医药资源,分别适配日常食疗养生、阶段性保健调理、临床疾病参考等不同场景。
重要说明:本App为中医药网络药理学成果可视化、科普化应用工具,所有检索结果仅作学术研究与养生科普参考,未经专业医师辨证印证前,不可作为中药服用、临床诊疗的直接依据。
二、底层数据集基础:标准化 TCM 异质关联库
1. 数据集来源与规模
本系统底层数据全部源自2024年《Data in Brief》公开开源的TCM异构网络数据集,原始数据存储于Dryad公共科研库(https://doi.org/10.5061/dryad.wh70rxwx9),融合五大权威数据库,实现多维度数据互补、交叉验证:
HIT2、HERB数据库:收录1254味中药材、168797组药材-活性成分-蛋白靶点关联数据,是中药机制研究的核心数据源;
《中国药典》(CHPA):提供权威的药材功效、主治病症、症状匹配规则及官方分类标准,保障内容合规专业;
SymMap数据库:依托文本挖掘技术,构建标准化的症状-疾病语义关联体系,适配临床症状检索场景;
自行收集:整合国家四批药食同源目录、《可用于保健食品物品名单》、中成药方剂名录,实现药材合规分层分类。
该数据集构建了完整的五层中医药关联网络,涵盖1254味中药材、1027种临床症状、2208个人类蛋白靶点、1237种天然活性化合物、373类中医核心功效。配套完善的7张标准化CSV关联数据表,包含药材-靶点、药材-成分、药材-症状、药材-功效、药材配伍、蛋白互作、症状关联等核心数据。所有关联关系均通过卡方检验、FDR多重校验过滤低置信度数据。
三、核心架构与检索逻辑
核心检索入口
入口 1:临床症状检索
用户可自主输入失眠、口干、关节酸痛、舌苔厚腻等各类临床症状,系统调取标准化药材-症状关联数据表,筛选P<0.05的高置信度匹配药材。检索结果将自动分层展示药食同源食材、保健类药材、药用方剂三类资源,同时同步展示各类药材的核心活性成分、作用靶点及适配场景、使用禁忌。
入口 2:疾病核心基因 / 靶点检索
支持用户输入TNF、PPARG、VEGFA等疾病核心致病基因与蛋白靶点,系统遍历全量药材-靶点关联数据集,通过计算靶点交集数量生成匹配得分,按匹配度降序输出结果。最终同样完成三类中医药资源分层展示,精准匹配靶向调控疾病靶点的本草资源,适配网络药理学科研分析场景(疾病自动填基因功能待优化验证)。
四、项目创新亮点
1. 落地网络药理学研究成果,赋能中医药创新应用:打破网络药理学成果仅用于论文研究的局限,将药材、成分、靶点、疾病的关联机制可视化落地,依托核心靶基因实现反向药材匹配,为中医药机制研究、新药研发、食疗创新提供便捷工具。
2. 打通中西医双向检索逻辑,适配多元用户习惯:贴合大众与科研人员对西医症状、疾病、基因靶点的认知习惯,实现“西医维度输入、中医药资源输出”的双向检索,打破中西医信息壁垒。相较于传统单一的中药正向查询工具,本平台创新性支持症状、疾病、基因多维度反向溯源,适配不同知识背景的用户需求,让中西医结合研究与日常中医养生更加便捷高效。
五、适用人群与使用场景
本App聚焦中医药科研落地与生活化应用,兼顾学术研究与大众科普,核心适用人群及使用场景如下:
慢病食疗养生人群:针对糖尿病、高血压、失眠等常见慢病,精准筛选可长期安全食用的药食同源食材,匹配专属家常药膳方案,实现科学日常调理;
中医学生与科普工作者:清晰区分药食同源食材、保健食品原料、药用方剂的边界,规避养生误区与误用风险,助力中医药科普标准化;
食品研发与科研从业者:快速筛选适配慢病调理的合规药食同源原料,可下载原始标准化数据集,用于中医药网络药理学研究、功能性食品研发等工作。
六、总结
本中医药智能检索App基于权威TCM异质网络数据集开发,以“多维度输入检索、标准化分层输出”为核心优势,打通了临床症状、现代疾病、分子基因靶点与传统本草资源的关联链路。平台既依托多源权威数据库实现中药现代分子机制的科学化阐释,又严格遵循国家药食同源、保健食品相关法规完成资源分类,兼顾了科研工具的专业性与大众食疗的安全性。基于Streamlit的轻量化架构,无需复杂部署与专业技术基础,操作便捷、落地性强,是一款适配中医药学习、科研分析、养生科普的一体化智能检索工具,为中医药现代化、生活化应用提供了高效支撑。
访问地址:clinicalappmatrix.online
✿
发现医学研究的趣与美,with you!
夜雨聆风