近期小编对SHAP科研分析软件进行更新,现在是6.0版本,对许多功能进行了更新,但是考虑到地理空间数据(矢量和栅格数据)输入模型训练是会很卡,有时候直接卡死,而且地理空间数据的SHAP分析应该要支持地理空间显示,因此修改了数据导入的方式,只支持文本数据的输入(.csv,.xlsx和.xls格式),同时只是针对于二分类和回归模型。后续会考虑出一个针对地理空间数据版本。主要更新在一下几个部分:
软件主界面

1、软件布局进行重构:增加结果分析和SHAP可视化模块。结果分析模块主要是针对分类模型可以绘制ROC曲线、PR曲线、混淆矩阵、校准曲线等,针对回归模型有残差散点图、残差分布图、Q-Q图等。SHAP可视化模块主要是针对普通的SHAP分析(蜂巢图、特征重要性柱状图、瀑布图、力图、热图、依赖图、决策图),这是和科研绘图有区别的。


2.所有表格导出:在进行绘图以后增加了一个功能,在导出图片的同时也会导出对应图片的绘图数据,包括回归数据的真实值和预测值,R2这些指标,分类模型的ROC曲线,混淆矩阵数据以及SHAP图的数据都可以进行导出。

3.增加了部分模型和参数优化方式。在原来六个树模型的基础上,增加了DT、SVM、LR、KNN、NB、AdaBoost模型,但是使用这些模型的时候不是很稳定,有些模型SHAP比较慢,容易卡死,同时增加网格搜索方法寻找最优超参数,现在支持贝叶斯、网格搜索和自定参数三种方式,而且贝叶斯和网格搜索可以设置参数范围以及步长,同时针对SHAP分析可以选择是全局还是局部(测试集)SHAP。

4.优化了UI控件。针对软件在不同屏幕电脑上有时候显示不全,无法滑动。优化后左边和右边可以随意控制,同时针对左边的参数窗口可以上下滑动,更加方便快捷。

5.针对科研绘图里面的两个包含玫瑰花图的模块进行优化,可以自定义控制位置,以及玫瑰花图的缩放,避免压覆的情况,径向玫瑰图和蜂巢图也是一样的方式。
修改后:
6.新增三种科研绘图。就是公众号上发布的新的三款SHAP图(两个SHAP相关性热力图和环形蜂巢图),原来的图依然还有。



总结
现在这款软件已经不仅仅是SHAP的软件,可以使用这款软件跑通机器学习的很多流程,包括数据读取、模型训练、指标输入、以及SHAP的各种出图,而且SHAP图包含普通的科研两种。
软件获取也还是老方式,可以添加小编微信获取,但是开发也需要耗费人力,软件158元永久使用,软件发布一周内限时128元。也可以考虑加入加入小编科研绘图VIP群,268/年,可以获取公众号上的科研绘图相关所有文章源代码,同时赠送新款的6.0软件。VX:GISyanjiushengya!!!
软件能做那些图
1.二分类模型六种曲线图
- 2.回归模型五种图

3.八种普通SHAP相关的简单图(支持单特征依赖和交互依赖)
- 4.SHAP科研绘图12种

夜雨聆风