数据准备整理
OnekeyAI现成的技术方案工具,直接套自己的数据使用,从提特征到论文Methods,Results一键生成,实现SCI量产。

一、乳腺癌淋巴结转移预测(除了影像和标签其他的数据有啥用啥,数据100起步,越多越好,无上限)
主要影像手段: MRI(多序列,多参数)
1. 影像学资料(DICOM格式)
术前MRI(序列有啥用啥):
T1加权平扫序列
T2加权脂肪抑制序列
DWI弥散加权成像
DCE-MRI动态对比增强MRI
新辅助治疗后MRI(如适用):同术前序列,重点评估治疗反应及残余淋巴结状态
影像学评估指标:淋巴结短径、Node-RADS评分、淋巴结形态学特征(边缘、信号均匀性、有无坏死)、强化模式(均匀/不均匀/环形)
2. 临床资料
年龄(岁)、性别(女性)
身高(cm)、体重(kg)、体质指数(BMI)
月经状态(绝经前/围绝经期/绝经后)及初潮年龄
生育史、哺乳史、口服避孕药使用史
既往乳腺良性疾病史、乳腺癌家族史
肿瘤部位(左/右乳腺,象限)
新辅助治疗/辅助治疗史(化疗、放疗、内分泌治疗、靶向治疗)
手术方式(保乳术/全乳切除术/腋窝淋巴结清扫术/前哨淋巴结活检)
3. 实验室/病理学指标
血常规:白细胞计数、血小板计数、中性粒细胞与淋巴细胞比值(NLR)、血小板与淋巴细胞比值(PLR)
肿瘤标志物:CA15-3、CA125、CEA(根据临床常规可选)
分子病理指标:ER、PR、HER2表达状态、Ki-67增殖指数
组织病理学指标:组织学类型(浸润性导管癌/浸润性小叶癌等)、组织学分级、淋巴血管侵犯(LVI)、周围神经侵犯
穿刺/病理资料:术前穿刺细胞学/组织学结果,术后病理淋巴结状态
4. 生存资料(生存任务更容易发高分)
短期:3个月、6个月(无病生存DFS、局部复发LR、远处转移DM)
中期:12个月、24个月、36个月(常用终点)
长期:60个月(5年)、120个月(10年)无病生存(DFS)、总生存(OS)
5. 标签文件(研究的结局,execl表通过另存为.csv格式)
转移:1
未转移:0

二、必然可行的研究方案
一、单序列影像的研究方案
方案1:组学 + 2D深度学习 + 额外两个深度学习模型对比
技术路径:
提取影像组学特征(PyRadiomics)
训练2D深度学习模型(如ResNet、DenseNet)
额外再训练两个不同的2D CNN模型(如VGG、EfficientNet)进行对比
融合方式:前融合(特征拼接)+ 后融合(结果加权)
可解释性:SHAP、Grad-CAM
创新点:多模型对比+融合,提升泛化能力
方案2:组学 + 2.5D深度学习
技术路径:
提取最大ROI截面的2.5D多通道数据(如三个相邻切片)
训练2.5D CNN模型
与组学特征进行前融合或后融合
优势:兼顾空间信息与切片连续性
方案3:组学 + 3D深度学习
技术路径:
裁剪3D VOI区域(使用okt crop max roi --axis 3D)
训练3D CNN模型(如3D ResNet)
提取3D深度学习特征 + 组学特征融合
优势:保留肿瘤三维结构信息
方案4:2.5D深度学习 + Transformer
技术路径:
构建2.5D多通道图像序列
使用Vision Transformer(ViT)进行建模
可与组学特征进行融合
注意事项:ViT模型需要较多epoch(建议600以上),无预训练参数
二、多序列影像(如T1、T2、DWI等多序列)的研究方案
方案5:组学 + 2D深度学习 + 序列对比
技术路径:
对每个序列单独提取组学特征 + 2D深度学习特征
对比不同序列的建模效果
选择最优序列或进行序列融合
创新点:系统评估各序列贡献,指导临床选择最优序列
方案6:双通道2D深度学习 + 2.5D深度学习
技术路径:
构建双通道2D输入(如原始图像 + mask)
同时构建2.5D多通道输入(连续三切片)
分别训练两个模型,结果融合
优势:兼顾图像结构信息与切片连续性

三、参考文献










夜雨聆风