乐于分享
好东西不私藏

LogisticApp-变量基础筛选介绍-最优子集回归

LogisticApp-变量基础筛选介绍-最优子集回归

logisticApp软件获取

医学科研设计、统计分析、SCI解读

添加微信859929351

服务范围:临床研究设计、统计方法选择与验证、SCI图表解读与撰写支持

精通 SPSS、STATA、SAS、R、GraphPad Prism 等多种医学统计软件,提供全流程统计分析支持!可覆盖各类医学领域 SCI 研究 / 二次分析,从「样本量估算→统计模型构建→混杂因素校正→敏感性验证→图表可视化→异质性 / 稳健性分析」一站式助力,擅长破解「复杂数据混杂」「非正态变量处理」「多中心效应控制」等统计难题,精准拆解 SCI 文献统计逻辑,助力高效吃透研究设计与结果解读,加速高分医学 SCI 产出!

文末联合清华大学出版社,赠送图书福利

         

正文开始

最优子集回归模块支持自定义全子集分析,并提取所有模型的AIC、BIC、AUC、HL拟合优度P值等指标。

最优子集回归操作及结果呈现

1.变量选择
  • 分层变量:此处不需要,可不选;
  • 因变量:二分类变量,比如发病与否,生存与否;
  • 结局事件:指定因变量中发生结局事件的值,默认第二水平。
  • 连续自变量:比如身高、体重等;
  • 分类自变量:比如性别、学历;
  • 点击提交:输出结果
2.详细设置
  • 变量数:定义自变量数量固定的模型。例如你一共选了 10 个候选变量,将数值设为 5,系统就只展示恰好包含 5 个自变量的回归模型;
  • 包含:精准锁定模型,只展示必须带有你指定的某个 / 某些自变量的回归结果;
  • 参考水平:分类变量自动默认第一水平为参照,支持手动自定义修改参考组别。
  • 小数位数设置:自由设置回归结果的小数保留位数
  • 详细设置中已预设最优选择,也可自定义修改

3.分析过程
    实时显示分析进度
    不建议候选自变量数超过20
    此时模型数量将达百万级
    短时间内无法跑完。

    4.输出结果

    🧠 手动选择统计算法

    • 底层基于 R 语言 leaps 包(v4.5.1)核心函数 regsubsets() 进行全量子集筛选,结合 stats 包(v4.5.1)glm()(设置 family = binomial())构建 Logistic 回归模型,采用最大似然估计法拟合各子集模型参数,通过 summary() 函数提取各模型的 AIC、BIC、AUC、HL_Pvalue 等综合评价指标,自动完成1023 种变量组合模型的批量拟合与性能排序,结果符合临床研究统计学规范,可直接用于论文方法学溯源。

    • 最优子集回归:系统自动枚举所有可能的变量组合,生成全部候选模型集合;并依据 AIC(赤池信息准则)、BIC(贝叶斯信息准则)、AUC(受试者工作特征曲线下面积)、HL_Pvalue(Hosmer-Lemeshow 检验 P 值) 四大核心指标对模型进行综合评分,自动筛选出 “拟合优度最优 + 变量复杂度最优” 的子集模型,实现从 “全变量模型” 到 “精简预测模型” 的自动化优选。

    📌 模型优选与对比能力

    •  全组合枚举:支持从指定数量的自变量中,自动组合生成所有可能的回归模型(如 10 个自变量可生成 1023 个模型),覆盖从 1 变量到全变量的全部场景,避免人工筛选遗漏最优组合。

    • 多准则综合评价:同时输出 AIC、BIC、AUC、HL_Pvalue 四项指标,AIC/BIC 值越小、AUC 值越大、HL_Pvalue>0.05,代表模型拟合优度与校准度越佳;系统自动排序并展示 Top 最优模型,便于快速定位最佳变量组合。

    • 自定义变量锁定:支持指定固定变量数(如只保留 3-5 个变量的精简模型)或强制包含特定变量(如必须包含临床意义明确的核心指标),精准筛选符合研究需求的最优子集。

    📋 专业结果输出

    • 生成最优子集分析三线表:包含模型 ID、AIC、BIC、AUC、HL_Pvalue、变量数、模型公式(Formula),按 AUC 或 AIC 降序排列,红色高亮标记 Top 最优模型,直接适配医学论文模型选择与变量筛选表格规范。

    • 方法说明:明确标注模型类型(最优子集 Logistic 回归)、变量组合枚举规则(全组合穷举法)、模型评价准则(AIC/BIC/AUC/HL_Pvalue)、参数估计方法(最大似然估计),便于论文方法学部分直接引用。

    • 解读指南:指导用户通过 AIC/BIC 判断模型复杂度与拟合优度、AUC 判断模型区分能力、HL_Pvalue 判断模型校准度;结合研究需求选择 “变量少且性能优” 的最优模型,避免过度拟合,同时说明子集分析需结合临床专业验证,确保模型实用性。

    📋 高效便捷操作

    • 支持一键下载三线表 / 复制结果,直接粘贴到论文、汇报 PPT,大幅提升科研效率。

    • 界面直观友好,无需编写代码,点击即可完成全组合模型拟合与多准则优选,显著降低医学科研人员的统计操作门槛。

    4.1 最优子集结果

    福利赠送

    公众号spss1949内回复

    20251028

    20251127

    赠送清华大学出版社图书资源

    《GraphPad Prism 统计分析与科技绘图》

    出版社:清华大学出版社

    出版时间:2025年6月第1版

    核心亮点:52个典型案例+11小时配套视频+100余种图形实战+9大统计模块,零基础也能精通GraphPad Prism

    《R语言临床预测模型实战》

    出版社:清华大学出版社

    出版时间:2025年12月第1版

    核心亮点本书聚焦临床预测模型的核心流程,从模型构建、变量筛选,到模型评价、验证,全程结合R语言实战案例,涵盖临床研究中最常用的回归模型与机器学习方法。所有代码可直接复制运行,配套完整数据集,让零基础也能快速上手临床预测模型研究!