模型评估与可视化分析工具 v2.0




一、用户界面
左侧面板包含四大功能模块:
-
数据加载:选择Excel文件,指定目标列、特征列和时间列
-
数据预处理:缺失值处理、特征标准化、训练集划分
-
模型选择与训练:支持线性回归、岭回归、Lasso回归,可调节模型参数和交叉验证
-
可视化设置:颜色方案、直方图区间、图表导出格式
二、数据预览与统计
加载数据后,工具会立即显示数据的统计信息和前20行预览:
-
数据概览:样本数量、特征数量、目标变量的统计描述(均值、标准差、最值)
-
缺失值统计:目标列和特征列的缺失情况一目了然
-
表格预览:直观查看数据结构,确保数据加载正确

三、多维度可视化分析(核心亮点)
1. 散点分析 – 预测值vs真实值
功能:以散点图形式展示训练集和测试集的预测效果,并附带边缘分布直方图。
解读要点:
-
点越靠近对角线(y=x),预测越准确
-
边缘分布展示了真实值和预测值的分布形态
-
右上角实时显示训练集和测试集的R²、调整后R²、RMSE指标
应用场景:快速评估模型的整体拟合效果,发现系统性偏差。
2. 残差诊断 – 四大诊断图
这是回归分析中最重要的诊断模块,包含四个子图:
① 残差vs拟合值图
-
检查残差是否随机分布在零线附近
-
橙色趋势线帮助发现非线性模式
-
若趋势线有明显弯曲,说明模型可能遗漏了非线性关系
② 残差直方图 + 正态拟合曲线
-
评估残差是否服从正态分布
-
红色曲线为正态分布参考线
-
严重偏离正态可能影响统计推断的有效性
③ Q-Q图
-
检验残差的正态性
-
点越靠近参考线,越接近正态分布
-
两端偏离可能表示厚尾分布
④ Scale-Location图
-
检查异方差性(方差是否恒定)
-
横轴为拟合值,纵轴为残差绝对值的平方根
-
若趋势线水平或无明显模式,则方差齐性假设成立
3. 时序对比 – 预测序列跟踪
当数据包含时间列时,这个模块尤为有用:
上部分:实际值曲线 vs 预测值曲线
-
不同背景色区分训练集和测试集区域
-
实际值为实线,预测值为虚线
下部分:残差条形图
-
正负残差直观显示预测偏差
-
帮助发现时序上的异常波动
应用场景:时间序列预测、销售预测、股票走势分析等。
4. 特征系数分析 – 洞察特征重要性
对于线性模型,特征系数直接反映变量的影响程度:
左侧条形图:
-
按系数绝对值排序,红色为负向影响,绿色为正向影响
-
系数值直接标注在条形上
右侧气泡图:
-
气泡大小代表系数绝对值
-
颜色映射系数值(红-黄-绿渐变)
-
直观展示哪些特征对预测影响最大
底部显示截距项,完整呈现模型公式的关键参数。
5. 模型对比看板 – 多模型综合评估
当训练了多个模型后,这个看板提供了全方位的对比:
① R²对比柱状图
-
训练集和测试集R²并排显示
-
值标签直接标注在柱子上
② RMSE & MAE对比
-
四种误差指标并列展示
-
快速识别哪个模型误差最小
③ 多指标雷达图
-
综合展示测试R²、调整后R²、归一化RMSE、归一化MAE、解释方差
-
面积越大表示综合表现越好
④ 测试集散点对比
-
不同模型的预测点用不同颜色区分
-
直观比较哪个模型更贴近对角线
⑤ 残差分布小提琴图
-
展示测试集残差的分布形态
-
红色点为均值,蓝色点为中位数
⑥ Adj.R² & MAPE对比
-
双Y轴展示:左轴为调整后R²,右轴为MAPE百分比
-
兼顾准确性和误差百分比
四、实际使用流程
-
加载数据:选择Excel文件,指定目标列和特征列
-
预处理:选择缺失值处理方法和标准化方式,设置测试集比例
-
训练模型:选择模型类型,调整参数(如岭回归的alpha值),可选交叉验证
-
查看结果:自动跳转到散点分析图,浏览各个可视化标签页
-
导出图表:支持PDF、PNG、JPG、SVG格式,直接保存到本地
五、技术亮点
-
自动计算调整后R²(考虑特征数量)
-
安全的MAPE计算(避免除零)
-
交叉验证结果整合(均值±标准差)
本版本无密码,可购买一个版本多人使用。需要的用户可直接后台私信联系。
获取本版本仅需60元,获取本版本后续免费更新版本仅需100元。
其它版本在接下来的一段时间,对于之前已经购买过的用户,也陆续会免费进行更新。
夜雨聆风