软件下载
CiteSpace 是学术界广泛使用的科学文献可视化分析工具,由陈超美教授团队开发。它基于共被引分析、聚类分析、突现检测等算法,能够绘制知识图谱、识别研究热点与前沿、展示学科演进脉络,广泛应用于图书情报、科学计量、管理学、医学及工程技术等领域。
一、CiteSpace 下载与安装
下载安装包点击上方提供的下载链接,获取 CiteSpace 安装程序(通常为
.exe格式或.zip压缩包)。CiteSpace 基于 Java 开发,需要系统预装 Java 运行环境。目前主流版本为 CiteSpace 6.2.x、6.3.x,请根据你的操作系统(Windows 64 位)选择对应版本。建议选择完整版安装包(包含内置示例数据和项目模板)。安装 Java 环境(如尚未安装)
CiteSpace 需要 Java 8(64 位) 或更高版本。若系统未安装 Java,请先安装(注意:用户可自行安装,本文不提供官网链接,但需提醒用户)。 安装后可在命令行输入 java -version验证是否成功。运行 CiteSpace 安装程序
双击安装包,若系统提示“是否允许此应用对设备进行更改”,请选择“是”。 阅读许可协议,勾选“我接受协议”,点击“下一步”。 安装路径:建议保持默认路径 C:\Program Files\CiteSpace,如需更改请确保路径不含中文字符。等待安装完成(约 2-5 分钟),点击“完成”。 启动 CiteSpace
安装完成后,桌面会生成 CiteSpace 快捷方式。双击启动。 首次启动时,程序会提示设置项目文件夹和数据库文件夹(请选择非系统盘的空目录,如 D:\CiteSpace_Projects和D:\CiteSpace_Data)。若弹出“安全警告”,选择“允许访问”即可。 汉化与初始配置
CiteSpace 默认界面为英文,但可在菜单栏 View → Language 中选择“简体中文”,重启后生效。 建议在 Preferences → General 中设置 “自动保存间隔” 为 5 分钟,避免分析过程中数据丢失。
❝⚠️ 注意事项:CiteSpace 对内存要求较高,建议在启动脚本中分配足够内存(见常见问题部分)。安装路径和项目文件夹不能包含中文或空格。
二、CiteSpace 基本使用技巧
1. 数据准备与导入
数据来源:CiteSpace 主要支持 Web of Science(WOS)、Scopus、CNKI(中国知网)、PubMed 等数据库的导出数据。 数据格式: WOS:导出为 “全记录与引用的参考文献” 的纯文本文件(.txt)。 CNKI:导出为 Refworks 格式,然后用 CiteSpace 内置的“CNKI 格式转换器”转换。 Scopus:导出为 CSV 或 BibTeX 格式。 导入步骤: 在 CiteSpace 主界面点击 “数据 → 导入/导出”。 选择对应的数据库类型(如“Web of Science”)。 将下载的文本文件放入 Data文件夹(如D:\CiteSpace_Data),设置Project文件夹(如D:\CiteSpace_Projects\demo)。点击“开始转换”,等待处理完成。
2. 项目创建与参数设置
新建项目:点击 “新建” 按钮,指定项目文件夹和数据库文件夹。 时间切片(Time Slicing):设置分析的时间范围(如 2010–2025)和切片长度(通常为 1 年)。 节点类型(Node Types):选择分析维度,常用选项: 作者(Author):作者合作网络。 机构(Institution):机构合作网络。 国家(Country):国家/地区合作网络。 关键词(Keyword):关键词共现分析。 术语(Term):从标题、摘要中提取的术语。 被引文献(Cited Reference):文献共被引分析。 被引作者(Cited Author):作者共被引分析。 被引期刊(Cited Journal):期刊共被引分析。 阈值选择(Selection Criteria): Top N:每个时间切片选择被引频次最高的 N 个节点(常用 50 或 100)。 **Top N%**:选择前百分之几的节点。 g-index:使用 g 指数控制节点数量。 剪枝(Pruning):推荐勾选 “Pathfinder” 或 “Minimum Spanning Tree”,简化网络并突出主要结构。
3. 运行分析与结果可视化
开始运行:点击绿色 “GO!” 按钮,系统开始处理数据。分析时间取决于文献数量(几百篇几秒,上万篇需几分钟到几十分钟)。 结果解读: 聚类视图:不同颜色的区域代表不同研究主题的聚类。 时间线视图(Timeline View):展示各聚类中文献的时间分布。 时区视图(Timezone View):按时间排列节点,展示研究演化。 节点与连线:节点大小代表频次/被引次数;连线粗细代表共现/共被引强度;节点外围紫色环代表中介中心性(≥0.1 为关键节点)。 导出图谱:右键点击图谱区域,选择 “Save as Image” 导出为 PNG、JPG 或 PDF 格式。
4. 突现检测(Burst Detection)
功能:识别在特定时间段内频次急剧增加的关键词、文献或作者,用于发现研究前沿。 操作步骤: 运行分析后,在菜单栏选择 “Burstness”。 设置 γ 参数(默认 1.0,越大突现越严格)。 点击“View”,查看突现节点列表,可导出为 Excel。
5. 报告生成与数据输出
导出网络数据:点击 “File → Export → Network as...”,可输出为 Pajek (.net)、GraphML、XGMML 等格式,供 Gephi、Cytoscape 等工具进一步美化。 生成统计表格:在 “Summary of Clusters” 界面,可复制聚类信息(大小、轮廓值、平均年份、主要关键词)到 Excel。 保存项目:分析结果自动保存在项目文件夹中,下次打开可直接加载。
三、CiteSpace 常见问题与解决方法
问题 1:启动 CiteSpace 时提示“无法找到 Java 虚拟机”或“No JVM could be found”
原因:系统未安装 Java 或 Java 环境变量未配置。解决方法:
确认已安装 Java 8 或更高版本(64 位)。若未安装,请安装 Java(用户自行搜索下载,本文不提供官网链接)。 配置环境变量:右键“此电脑” → 属性 → 高级系统设置 → 环境变量 → 系统变量中新建 JAVA_HOME,值为 Java 安装路径(如C:\Program Files\Java\jdk1.8.0_301),并在Path中添加%JAVA_HOME%\bin。若仍报错,可在 CiteSpace 安装目录下找到 CiteSpace.bat或CiteSpace.exe,右键“以管理员身份运行”。
问题 2:分析过程中出现“OutOfMemoryError: Java heap space”内存不足错误
原因:默认分配给 CiteSpace 的内存过小(通常为 512MB),无法处理大量文献数据。解决方法:
修改启动参数:找到 CiteSpace 安装目录下的 CiteSpace.vmoptions或启动脚本CiteSpace.bat,用记事本打开。将 -Xmx512m修改为-Xmx4g或更高(如-Xmx8g),根据电脑实际内存设置(不超过物理内存的 70%)。保存后重启 CiteSpace。若没有该文件,可在启动时按住 Shift键双击图标,在弹出的控制台中手动输入内存大小(如4096)。同时建议减少每次分析的数据量(如缩短时间切片、降低 Top N 值)。
问题 3:从 CNKI 导入数据后,分析结果中出现大量“乱码”或无法识别中文关键词
原因:CNKI 导出的 Refworks 格式为 GBK 编码,而 CiteSpace 默认使用 UTF-8 编码。解决方法:
使用 CiteSpace 自带的 “CNKI 格式转换器”:在 “数据 → 导入/导出” 中选择“CNKI”,指定输入文件夹(存放从 CNKI 下载的 Refworks 格式 .txt 文件)和输出文件夹。 转换后的文件会自动处理编码问题。 如果仍然乱码,可用记事本打开原始文件,另存为 UTF-8 编码(编码选择 UTF-8)。 建议在项目设置中将语言改为“中文”,以便正确显示中文标签。
问题 4:运行分析后生成的图谱节点过多、连线混乱,难以阅读
原因:未使用剪枝功能,或阈值设置过低。解决方法:
在参数设置中,勾选 “Pruning” 下的 “Pathfinder”(最适合文献共被引分析)或 “Minimum Spanning Tree”(适合关键词共现分析)。 提高阈值:将 Top N 从 50 降低到 30 或 20,或使用 Top N% 设置为 10%。 在 “Visualization” 面板中,调整节点标签显示的阈值(如只显示频次 ≥5 的关键词)。 使用 “Layout” 菜单中的 “Circle”、“Kamada-Kawai” 等布局算法,改善图谱可读性。 对于过于密集的网络,可先运行“聚类”生成聚类标签,然后点击 “Hide Node” 隐藏部分小节点。
安装
夜雨聆风