AI皮肤癌App管用吗?

研究背景:AI皮肤App的火热与证据鸿沟
自2019年起,SkinVision——一款利用卷积神经网络分析智能手机拍摄的皮肤病变图像、提供低/中/高风险评估的应用程序——在荷兰被纳入医保报销范围。Wakkee团队此前利用保险理赔数据的回顾性研究发现,应用使用者虽被诊断出恶性、癌前病变及良性肿瘤的概率均升高,但无法区分这是“早期发现”还是“过度诊断”。为回答这一问题,团队开展了SPOT随机对照试验。
研究方法:近2万人的随机对照设计
关键结果
12个月随访结果显示,干预组与对照组的组织学确诊黑色素瘤检出率分别为0.26%和0.31%,风险差-0.05%(P=0.68),无统计学差异。所有类型皮肤癌(包括鳞癌和基底细胞癌)的检出率分别为2.66%和2.27%(P=0.10),癌前病变检出率分别为6.9%和6.3%(P=0.23),均未达到统计学显著性。
“我们原本预期干预组会有更多皮肤癌诊断,结果令人有些不知所措,”Wakkee在报告中坦言。
但App使用确实增加了良性病变就诊率
在良性皮肤病变相关的医疗就诊方面,干预组显著高于对照组(3.9% vs 2.6%,P<0.001)。这意味着,免费使用皮肤App并没有帮助更多人发现皮肤癌,反而促使更多人为良性病变跑去医院。
试验参与者本身可能已存在“健康用户偏倚”
研究者进一步将试验参与者与保险公司中超过20万名未参与研究的非应答者进行了比较,发现了一个关键差异:试验参与者在该期间的皮肤癌前病变或恶性病变诊断率几乎是非应答者的三倍(6.7% vs 2.4%,P<0.001)。
Wakkee认为,这是因为参与者被告知研究旨在评估该技术对皮肤病变评估的“潜在影响”,这可能引入了一种固有偏倚:对照组参与者虽然没有App,但可能因为知道自己参加了一项关于皮肤AI的研究,而更加主动地就医检查任何可疑皮损。换言之,对照组的行为可能已经“被干预”了。
专家观点:App的真正角色或许不是患者自查
在初步的试点研究中,Wakkee团队对50名因皮损想要就医的患者提问:如果App给出低风险评级,你是否还会去看医生?其中半数回答“会留在家”。但后续还需要真实世界的行为研究来验证。
结论与启示

版权信息

夜雨聆风