在流行病学研究与数据分析实践中,统计软件环境的正确配置是开展一切后续工作的基础。R语言作为一款开源、免费的统计计算与图形绘制工具,已被广泛应用于医学研究、公共卫生、生物统计等领域。本文旨在系统介绍R软件的基本功能及其在流行病学中的应用,并提供Windows环境下R、Rtools及RStudio的完整安装与配置流程,仅供参考。
二、R软件概述及其在流行病学中的应用
2.1 R软件简介
R语言由Ross Ihaka和Robert Gentleman于1993年在新西兰奥克兰大学开发,基于S语言语法,遵循GNU通用公共许可证。R的核心优势包括:
完全开源、免费,无使用限制; 拥有丰富的扩展包(超过2万个CRAN包); 强大的数据清洗、统计分析、图形绘制功能; 与RStudio集成后提供友好的开发环境; 支持可重复研究(动态文档生成)。
2.2 流行病学中的典型应用场景
R语言在流行病学全流程数据分析中发挥着重要作用,具体包括但不限于以下方面:
数据管理与清洗:利用 tidyverse、dplyr包实现多源异构数据的合并、筛选、变换与异常值处理。描述性统计与可视化:计算发病率、患病率、死亡率等核心指标,绘制直方图、箱线图、森林图、空间分布图等。 现况研究:估计患病率及其置信区间,进行抽样权重调整。 队列研究:计算相对风险(RR)、归因危险度(AR),拟合Cox比例风险模型( survival包)。病例对照研究:计算比值比(OR),进行条件逻辑回归。 临床试验与随机对照试验:分析干预效应,使用 lme4包拟合混合效应模型。筛检与诊断试验评价:计算灵敏度、特异度、约登指数,绘制ROC曲线( pROC包)。时间序列分析:应用ARIMA模型预测传染病发病趋势( forecast包)。空间流行病学:利用 sf、ggmap包进行疾病制图与空间自相关分析。系统综述与Meta分析:使用 meta、metafor包合并效应量,评估发表偏倚。因果推断与孟德尔随机化:借助 MatchIt、MendelianRandomization等包进行倾向性评分匹配与遗传工具变量分析。
综上所述,R语言已成为现代流行病学研究中不可或缺的分析工具,掌握其安装与基本使用方法是每位公共卫生研究者的基本功。
三、Windows环境下R及相关组件的安装流程
3.1 R的安装
由于CRAN主站位于国外,下载速度较慢,建议使用清华大学开源软件镜像站。
镜像地址:https://mirrors.tuna.tsinghua.edu.cn/CRAN/ 进入后点击“Download R for Windows” → “base” → “Download R 4.6.0 for Windows”(文件名:R-4.6.0-win.exe)。 若需历史版本,可在base页面点击“Previous releases”选择R 4.6.0或其他版本。
下载完成后,双击安装包,按照向导进行安装。安装路径可自定义(如D盘),建议避免使用中文路径或空格。安装语言选择默认(英文)即可。
以R4.6.0的安装为例,可按如下操作进行:



3.2 Rtools的安装
Windows系统下,许多R包(尤其是需要编译C/C++代码的包)要求安装Rtools工具链。若不安装,install.packages()可能频繁报错。
在镜像站首页点击“Rtools” → 选择“Rtools4.5” → 下载“Rtools4.5 installer”。 安装时建议自定义路径,例如 D:\rtools4.5。安装完成后重启计算机,确保系统环境变量生效。


3.3 RStudio的安装
RStudio是R的集成开发环境,提供代码编辑、语法高亮、项目管理和图形预览等便利功能。
官网下载地址:https://posit.co/download/rstudio-desktop/ 点击“Download RStudio Desktop for Windows”,下载后直接安装。 若官网访问缓慢,可使用代理或通过校内共享文件获取安装包。

注:为方便读者,相关安装文件(R 4.6.0、Rtools4.5、RStudio)已打包上传,请点击文末 “阅读原文” 获取下载链接。
3.4 R包存储路径配置(避免C盘爆满)
为保持系统整洁并避免C盘空间不足,建议将R包统一安装在非系统盘(如D盘)。在RStudio的Console中依次执行以下命令:
# 1. 创建专用包目录dir.create("D:/R_Packages", recursive = TRUE, showWarnings = FALSE)# 2. 写入R的环境配置文件writeLines('R_LIBS_USER="D:/R_Packages"', con = "~/.Renviron")# 3. 立即生效.libPaths(c("D:/R_Packages", .libPaths()))配置完成后,所有通过install.packages()安装的包都将默认存放于D:/R_Packages目录下。
3.5 安装结果验证
运行以下代码,检查环境是否配置正确:
cat("当前 R 版本:", R.version$version.string, "\n").libPaths()[1]file.exists("~/.Renviron")预期输出示例(以实际显示为准):
当前R版本:R version 4.6.0 (2025-xx-xx) 包路径: D:/R_Packages配置文件存在: TRUE
若三项结果均正常,则表示安装与配置成功。
四、常见问题与注意事项
中文用户名问题:若Windows用户名包含中文字符,可能导致RStudio闪退。可尝试修改系统临时文件夹路径(设置环境变量TEMP、TMP为 D:\Rtemp)。R包安装失败:可更换CRAN镜像源(清华、阿里云、中科大等),或在RStudio中通过“Tools → Global Options → Packages → Change CRAN mirror”修改。 Rtools未被识别:安装后若编译包失败,检查系统PATH是否包含 D:\rtools4.5\usr\bin,重启电脑通常可解决。RStudio无法启动:右键以管理员身份运行,或检查安装目录是否包含特殊字符。
五、结语
R软件环境的正确配置是开展流行病学数据分析的第一步。本文详细介绍了R、Rtools及RStudio在Windows系统下的安装与配置方法,并概述了R语言在流行病学研究中的典型应用场景。希望本文能为初入R语言领域的公共卫生研究者提供清晰、可靠的操作指南。后续科研日记将继续介绍R的基本语法与流行病学常用包的使用示例。
相关安装文件获取方式:请点击本文底部左下角的 “阅读原文” ,使用百度网盘下载(需跳转至百度网盘App完成下载)。因平台限制,直接点击链接后可能需手动输入提取码,提取码见网盘页面提示。
参考文献
[1] 卡巴科弗 R I. R语言实战[M]. 第2版. 王小宁, 刘撷芯, 黄俊文, 等, 译. 北京: 人民邮电出版社, 2016.
[2] 刘跃伟. R语言的流行病学应用[M]. 北京: 电子工业出版社, 2025.
夜雨聆风