▼ 做您定制的类似分析,请与刘老师联系。
不做实验,也能发IF10+SCI?正在悄悄流行的文献计量分析,不仅是“论文捷径”,更是“基金申请外挂”!

引言
代谢功能障碍相关脂肪性肝病(MAFLD)已成为最常见的慢性肝病,并且是终末期肝病的重要危险因素。翻译后修饰(PTMs)通过调控脂质代谢、炎症和纤维化等过程,在MAFLD的发病机制中发挥关键作用。本研究旨在对MAFLD中PTMs相关研究的发展趋势及知识空白进行系统性、数据驱动的分析。
本研究从Web of Science核心合集(WoSCC)数据库中检索了2005年至2024年间与MAFLD中PTMs相关的文献。利用CiteSpace、VOSviewer、R语言中的Bibliometrix以及大语言模型对数据进行了定量和定性分析。最终共纳入2401篇符合条件的文献。这些文献主要来自71个国家和2732个机构,年增长率为20.76%。中国在发文量方面位居首位(n = 902,占37.6%),而美国的总被引次数最高(n = 31,536)。共有15,948位作者参与了该领域的研究。其中,Jung, Tae Woo发表文章数量最多(n = 21),且总被引次数最高(n = 583)。期刊《Hepatology》发表的相关论文数量最多(n = 39)。
新兴研究主题包括“分子对接”、“泛素化”、“N6-甲基腺苷”、“乙酰化”、“甲基化”和“代谢”等。大语言模型揭示了MAFLD发病过程中涉及的多层面机制。本研究为该领域的全球合作格局、研究热点及前沿方向提供了重要见解,有助于为深入理解PTMs相关的MAFLD奠定基础。

该文2026年发表于International Journal of Surgery,约 13+, JCR: Q1
▼ 想发表自己的文献计量分析论文?点击👇获得更多高质量文献计量分析模板。

(👆经典文献计量分析模板,持续更新中)
以下分为三个方面进行解读。
一. 检索策略
数据来源与检索策略于2025年1月21日检索Web of Science核心合集(WoSCC)数据库(2005–2024年)。为避免数据库更新偏倚,所有数据在同一天完成检索并下载完整记录(TXT格式)。仅纳入Article和Review类型文献。检索策略及流程见补充材料。
文献计量分析将数据导入VOSviewer(1.6.18)、CiteSpace(6.1.6)及R软件bibliometrix包进行分析。利用Python中spaCy(en_core_web_sm)对关键词进行清洗。采用参考文献出版年光谱分析(RPYS)及Multi-RPYS方法,识别研究领域的历史发展与关键文献。
大语言模型分析基于Microsoft GraphRAG框架,结合siliconFlow云API调用DeepSeek-R1-Distill-Qwen-32B模型(2025-01-20),于2025年3月20日完成分析。知识图谱构建包括图谱提取、摘要、声明提取及社区报告等步骤,并启用自动调优。
为降低模型幻觉风险,一方面依托GraphRAG自身优化机制,另一方面通过人工抽样验证(双人核查),总体准确率达90.4%,并剔除错误实体。
在迭代过程中,引入自反思机制,通过二元判断(logit bias = 100)评估信息提取完整性。
二.主要结果
1. 基本信息的定量分析
共纳入2005年至2024年间发表的2401篇关于MAFLD中PTMs的文献(其中研究性论文2058篇,综述343篇)。主要信息的定量分析结果见表1,图2A展示了该领域年度及累计发文量。

发文总量由2005年的7篇稳步增长至2024年的252篇,年增长率为20.76%。2018年之前累计发文不足1000篇,随后5年发文量保持相对稳定。每篇文献平均被引次数为39.39次,年均被引频次为4.745次。每篇文章平均有8.58位作者,其中24.78%的文献存在国际合作。总体而言,来自71个国家的15,948位作者在全球600种期刊上发表了与PTMs相关的MAFLD研究成果。

2. MAFLD中PTMs的全球格局与合作动态
该领域相关研究已在71个国家开展。其地理分布见图2B,发文量排名前10的国家列于表2。如表2所示,中国在发文数量上位居首位(n=902,占37.6%),其次为美国(n=492,占20.5%)和韩国(n=199,占8.3%)。值得注意的是,前三个国家的发文量占总量的五分之三,显示出其在该领域的主导地位。
美国的总被引次数(TCs)最高(31,536次),远超其他国家。尽管中国发文量较高(n=902),但其篇均被引率(TC/NP:25.67)低于其他国家。在前10个国家中,加拿大的TC/NP最高(89.90),其次为美国(64.10)和意大利(58.48),提示这些国家尽管发文量相对较少,但研究质量较高。
此外,美国和中国在总被引次数方面始终保持领先地位。2005–2024年间各国年度发文量见图2C,其中中国的年发文增长率最高,其次为美国和韩国。补充材料图3(链接:https://links.lww.com/JS9/F469)展示了发文量前10的国家。
在合作方面,美国的多国合作论文(MCP)数量最多,而中国的单一国家论文(SCP)数量最多。基于VOSviewer的国家合作分析显示,各国之间存在广泛的国际合作,尤其是中国与美国之间的合作最为密切(图2D)。这些合作关系可能受到不同国家文化背景及学术环境的影响。

共有2732家机构参与了MAFLD中PTMs相关研究的发表。发文量排名前10的机构见图2。其中,发文数量最多的前四家机构分别为武汉大学(n=125)、加州大学系统(n=121)、复旦大学(n=106)和中国科学院(n=104)。前10家机构共发表963篇文章,占总发文量的40.11%。其中50%的机构来自中国,另外50%来自美国。机构合作网络可视化图见图2F,分析显示既存在国内合作,也存在广泛的国际合作。

该领域共有15,948位作者参与研究。如表3所示,Jung Tae Woo为最高产作者,共发表21篇论文,总被引583次(h指数:13);其次为Jeong Ji Hoon,发表15篇论文,总被引257次(h指数:9)。

这两位高产作者均来自韩国。在其他高产作者中,3位来自中国,2位来自美国。前10位高产作者的年度发文趋势见图3A,其中Jung Tae Woo、Jeong Ji Hoon和Abd EL-Aty, A.M.在2018–2024年间最为活跃,而Shulman Gerald I.在2006–2018年间最为活跃。作者合作网络见图3B,展示了该领域多个研究团队及其相互关系。该网络分析表明,科研进展依赖于合作驱动,互利共赢的合作模式对于推动未来发展至关重要。
科研生产力通常以发文数量衡量,是评估作者科研能力和效率的重要指标,常用Lotka定律进行描述[37]。拟合的Lotka定律曲线见图3C,其中横轴为发文数量(x)的对数,纵轴为对应发表x篇论文的作者数量(Y)的对数。随着发文数量的增加,高产作者数量显著减少(图3C)。
关于MAFLD中PTMs的研究共发表于600种期刊。表4列出了发文量排名前10的期刊,这些期刊共发表434篇文章,占总发文量的18.2%。其中,Hepatology为发文量最多(n=39)且被引次数最高(n=5015)的期刊,其次为International Journal of Molecular Sciences(n=77)和Journal of Hepatology(n=52)。自2015年以来,International Journal of Molecular Sciences、Nature Communications和Nutrients的年发文量呈增长趋势,而PLOS ONE和Scientific Reports的发文量近年来有所下降。
我们采用双图谱叠加图(dual-map overlay)来展示期刊的学科分布(图3D)。图中左侧表示施引期刊,右侧表示被引期刊。不同颜色的连线代表不同学科领域,三条主要的引用路径通过线条粗细加以突出显示。
具体而言,绿色路径表明,发表于医学/临床类期刊的论文常被分子/生物/遗传学期刊引用;黄色路径则显示,分子/生物/免疫学期刊中的大多数文章主要被分子/生物/遗传学以及健康/护理/医学类期刊所引用。

表5列出了MAFLD中PTMs研究领域被引次数排名前10的文献,其被引次数范围为505至1489次。分析结果显示,发表于Comprehensive Physiology的“Energy metabolism in the liver”为被引次数最高的文章(n=1489)。发表于Cell(2021年)的“Mechanisms and disease consequences of nonalcoholic fatty liver disease”为第二高被引文章(n=974)。

共有68篇参考文献被纳入共被引分析,每篇文献至少被引用43次。从共被引网络图(图4A)可见,形成了4个具有较高可信度的主要聚类。表6列出了被共被引次数排名前10的文献,其中Kleiner DE等人发表的“Design and validation of a histological scoring system for nonalcoholic fatty liver disease”一文的共被引次数最高(n=291)。

突发检测(burst detection)可用于识别在特定时期内受到学术界高度关注的文献。引用突发强度排名前25的参考文献见图4B。

RPYS方法用于分析参考文献的时间特征,并追溯研究领域的历史根源。如图5A所示,黑色曲线表示被引文献的原始引用频率分布,红色波动曲线表示原始引用频率相对于5年中位数的偏差。2002年、2005年和2011年为峰值年份,其相对引用频率高于相邻年份,构成关键影响高峰。
图5B展示了MAFLD中PTMs研究的多重RPYS热图。图中纵轴表示施引文献的发表年份,横轴表示被引文献的发表年份。每个单元格的颜色由引用频率相对于5年中位数差值的排序转换值决定。1957年和1959年对应的单元格形成明显的深灰色“列或带”,表明这些年份在多个年份中具有较高的引用率。同样,1990年在连续4年内具有较高的引用率,而另一个时间段(文中重复,应为另一年份)在连续7年内也表现出较高引用率。这表明这些年份的历史文献属于该领域的经典文献。

4. 研究热点与趋势揭示主题演化
本研究从4201篇文献中提取了3876个作者关键词。通过对具有最强突发引用的关键词进行聚类分析,明确了MAFLD中PTMs研究的重要概念,并构建了相应的概念框架。如图6A所示,关键词被划分为10个不同颜色标识的聚类。诸如“MAFLD”(2021–2024)、“网络药理学”(2021–2024)、“肠道微生物群”(2020–2024)、“线粒体功能障碍”(2022–2024)、“肝脏炎症”(2022–2024)和“分子对接”(2022–2024)等关键词的突发持续至2024年,表明这些研究方向近年来受到广泛关注(图6B)。

各机构与国家在核心主题中的占比见图7A,展示了机构、国家与关键词之间的关联与分布。在机构层面,复旦大学和上海交通大学对“MAFLD”关注度较高;在国家层面,中国和美国在各研究热点中均占据重要地位。
通过多重对应分析(MCA)对领域概念结构进行分析,生成基于术语分布相似性的稳定二维图(图7B)。其中红色聚类代表研究最为集中的领域,而绿色和蓝色聚类则代表相对较少探索的方向。此外,我们还可视化了关键词随时间的变化趋势(图7C)。在过去5年中,“分子对接”“泛素化”“N6-甲基腺苷”“乙酰化”“甲基化”和“代谢”等成为新兴研究热点,这些方向有助于阐明疾病的病因、发病机制及临床意义。

我们进一步对2005年至2024年的主题演化进行了分析(图8)。将数据划分为四个阶段(2005–2009、2010–2014、2015–2019和2020–2024),并以2009、2014和2019为分界点。每个节点代表各时间段的主要主题,节点大小对应关键词数量,节点旁标注显示核心关键词及对应时间段。若两个时间段存在相同关键词,则以流线连接,其宽度反映主题之间的关联强度。

在早期阶段(2005–2009),研究主要集中于基础概念和初步探索,如“脂肪因子”“细胞凋亡”和“肝纤维化”。第二阶段(2010–2014)中,“MAFLD”成为核心主题,研究重点转向其发病机制,同时出现“脂解”“巨噬细胞”“糖组学”“生物标志物”和“癌症”等新主题。第三阶段(2015–2019)中,“线粒体功能障碍”和“MAFLD”为研究核心,主题进一步细化,出现“脂质生成”“脂肪酸氧化”和“PNPLA3”等新方向。第四阶段(2020–2024)中,研究更加深入至分子生物学和生物化学层面,重点关注“甲基化”“乙酰化”“磷酸化”等修饰机制。
5. 基于大语言模型的知识图谱揭示MAFLD发病机制的多维特征
基于大语言模型(LLMs)构建的知识图谱为MAFLD复杂相互作用提供了全面视角。如图9所示,每个圆圈代表一个实体,其大小表示该实体的连接程度(度),颜色表示其所属的社区。MAFLD位于中心节点,作为枢纽连接多个分支,包括多种风险因素、分子机制、环境因素及干预措施。
首先,知识图谱突出显示了与MAFLD相关的多种危险因素和环境暴露,如高脂饮食、吸烟、肥胖和糖尿病。其次,图中还展示了多种关键分子,包括但不限于PPARα、AMPK、SIRT6、FASN、TRIM56、FGF1、JNK和NLRP3。此外,还识别出多种潜在治疗药物和干预措施,如利拉鲁肽(liraglutide)、甜菜碱(betaine)、二甲双胍(metformin)、维生素E、抗氧化剂及抗炎药物。
同时,该图谱揭示了这些节点之间的因果关系。例如,在绿色聚类中,展示了利拉鲁肽、AMPK与脂质代谢之间的相互作用。这些研究为深入理解MAFLD的发病机制提供了新的视角,并为开发新的治疗策略提供了潜在靶点。

三. 讨论(简化)
PTMs在细胞信号传导及蛋白功能调控中发挥关键作用。本研究通过多种文献计量工具系统分析了MAFLD中PTMs的研究进展,共纳入2005–2024年间来自71个国家、600种期刊的2401篇文献。
结果显示,中国和美国在该领域占据主导地位。中国发文量最多,但美国在总被引次数和篇均影响力方面更具优势。尽管部分国家发文量较少,但其研究质量较高。合作模式方面,美国以国际合作为主,而中国以国内合作为主,提示未来需加强跨国合作并提升研究质量。
高被引文献主要集中于MAFLD发病机制,尤其是PTMs在脂质代谢、线粒体功能及胰岛素敏感性中的调控作用。AMPK介导的磷酸化及sirtuin相关的乙酰化被认为是关键机制,其失调可推动MAFLD进展。因此,PTMs被认为是潜在的重要治疗靶点。
学科发展呈现从临床研究向分子机制研究转变,并逐步扩展至健康管理和综合干预。近年来,MAFLD概念的更新及其流行病学研究推动了该领域的发展。
时间演化分析显示,2002年、2005年和2011年为关键发展节点,对疾病定义、病理评估及发病机制研究具有里程碑意义。
此外,“分子对接”“泛素化”和“m6A修饰”成为新兴研究热点。这些方向有助于揭示MAFLD的分子机制,并推动精准治疗策略的发展。
最后,本研究引入基于LLMs的GraphRAG方法构建知识图谱,整合关键分子、通路及干预策略,揭示了MAFLD的多维调控网络,为未来机制研究和靶向治疗提供了新思路。
编者按|从一项文献计量研究,看MAFLD中PTMs研究的进阶路径
这篇聚焦“MAFLD中蛋白质翻译后修饰(PTMs)”的研究,并非传统意义上的综述,而是一种典型的“数据驱动型整合研究”:以文献计量学为起点,系统描绘领域结构与演化路径,再结合多组学热点与分子机制解析,最终通过知识图谱回归疾病本质与潜在干预靶点。这种“结构识别—机制下探—系统整合”的研究范式,正逐渐成为高水平综述的重要方向。
从研究设计来看,该工作至少带来三点方法论启示:
其一,问题要“系统化”,而非“碎片化”。单一PTM类型或单一通路的研究已较为成熟,而围绕“PTMs×代谢重编程”“PTMs×炎症网络”“PTMs×表观遗传”等系统性问题,更有助于揭示疾病的整体调控网络,形成更具解释力的研究框架。
其二,研究要“可计算”,而非“纯经验”。通过文献计量学、突发分析、主题演化及知识图谱等方法,研究不再停留于经验性总结,而是具备了定量分析与结构挖掘能力。这种“准研究化综述”正在成为高影响力论文的重要特征。
其三,构建“多层级机制网络”。从流行病学与研究热点出发,延伸至分子机制(如泛素化、m6A修饰、磷酸化等),再连接潜在干预策略(如AMPK通路、代谢调控药物),形成“现象—机制—靶点”的闭环逻辑,是当前高分研究的核心能力。
进一步来看,该研究还提示未来的重要发展方向:一是深化PTMs之间的“交叉调控”(如泛素化与m6A的互作);二是结合多组学与AI技术,构建系统性调控模型;三是推动从机制发现向临床转化(靶向PTMs的治疗策略与生物标志物)过渡。
从更宏观的角度看,该领域的竞争正从“谁发现更多分子”,转向“谁能构建更完整的机制网络”。对于研究者而言,真正的突破不在于增加变量,而在于重构问题,并用数据与方法将其解释清楚。
原文链接:
广而告之:
如果您也需要对自己公司的产品或者对自己研究的领域做系统梳理,可以找美国Healsan恒祥医学科技做文献计量分析。并可同时获赠五个仅Healsan™大数据才有的福利:
文献检索老师参与学员选题的文献检索; 完成分析后,免费使用SCI论文神器10天,以完成论文撰写; 作者撰写好之后,获得免费查重; 作者投稿前,获得免费的选刊服务。

(点击👆,获得持续的医学大数据分析报告)
![]() | |
![]() | ![]() |
![]() | ![]() |
![]() | ![]() |
(点击👆图片,进入自己感兴趣的专辑。或点击“资源”,浏览本公众号所有资源)
夜雨聆风





