
日前,江苏省“人工智能+医疗健康”系列主题沙龙——医疗健康高质量数据集建设沙龙在苏州举行。活动由江苏省卫生健康委搭建平台,来自讯飞医疗、蚂蚁集团、数坤科技等40余家省内外AI医疗、医药企业,北京大学、南京大学、中国科学技术大学、国家信息中心等多家国内知名科研院所、机构的10余名专家学者,省“人工智能+医疗健康”工作专班部分成员单位,省内承担高质量数据集建设的医院项目负责人及团队骨干等嘉宾齐聚一堂,围绕医疗健康高质量数据集建设、可信数据空间、医学人工智能模型训练和临床应用等话题展开交流。
数据、算力、算法如何协同?
江苏正在搭平台
今年以来,江苏正在系统推进“人工智能+医疗健康”。江苏省卫生健康委党组书记、主任谭颖在致辞中表示,省卫生健康委联合省发改委等7部门印发《关于推进江苏省“人工智能+医疗健康”发展实施方案》,成立工作专班,组建创新实验室、创新联盟和专家组,推进省医疗健康数据开放平台建设,组织开展行业可信数据空间建设。目前,苏州行业可信数据空间已试运行,并启动开展“三医”协同和跨部门数据共享试点。

这场沙龙的意义,也正在于“搭平台”。医疗AI的发展,涉及医院、企业、科研机构、政府部门等多个环节。医院有真实场景,企业有技术能力,科研机构有方法论,政府部门则需要把规则、标准和协同机制搭起来。让这些力量面对面交流,很多卡点才有可能从“各说各话”变成“共同解题”。
谭颖提到,人工智能时代,“数据是燃料,算力是引擎,算法是方向盘”。目前,江苏已在危急重症、造血干细胞等21个专病高质量数据集基础上,成功研发13个专病专科垂类大模型。当前,全省正组织牵头医院推进急性心梗、脑卒中等15个专病高质量数据集建设,力争到2027年建成50个以上专病高质量数据集。
高质量数据集
到底“高”在哪里?
对普通群众来说,“高质量数据集”听起来有些专业。北京大学软件工程国家工程研究中心研究员、国家重点研发计划项目首席科学家黄雨给出了一个通俗解释:高质量数据集不是简单把医疗数据收集在一起,而是经过清洗、整理、标注、治理之后,真正能够支持人工智能模型训练和应用的数据资源。
换句话说,医疗AI不能只靠“喂数据”。如果数据记录不准、格式不统一、缺少专业标注,模型学到的规律就可能偏离真实临床。黄雨认为,对于人工智能和医疗健康来说,数据质量往往决定模型能走多远、用得多稳。高质量数据集可以帮助AI更准确地辅助诊断、预测疾病风险、推荐治疗方案,也能推动医学科研和医院管理智能化。
讯飞医疗总裁陶晓东博士分享实践经验:先汇聚临床、影像、检验、健康管理等多模态医疗数据,通过清洗脱敏、术语标化、语义对齐完成系统化数据治理。依托大模型自动预标、多层级专家标注、双盲质检与迭代优化的人机协同体系,搭建标准化、多场景、高可靠医疗数据集,并以知识互证质检、风险知识挖掘严守权威与安全底线,全方位为医疗大模型训练及智慧医疗产业应用筑牢坚实数据底座。

苏州样本:给数据上“安全锁”
也给应用开“合规门”
活动现场,苏州市“三医”协同创新可信数据空间进行推介发布。所谓“三医”,指的是医疗、医保、医药。过去,这些数据分散在不同系统、不同机构中。对AI医疗企业和科研团队来说,数据“看得见、用不了”,或者“想用、不敢用”,都是现实难题。
苏州市卫生健康信息中心副主任王宝燕介绍,在省级方案指引下,苏州健康医疗数智创新实验室前期经过一年多的数据汇聚治理,数据量已从最初的700亿条增长到1300多亿条。数据有了基础,应用才能更有序地落地。
她举例说,在“助医”方面,AI全科医生可以赋能基层医生;在“辅政”方面,苏州通过数据梳理出203个指标,辅助医院精细化管理;在“促研”方面,相关数据可以支撑临床研究和模型训练;在“便民”方面,未来市民实名认证后,可通过个人端健康助手查看健康画像,进行健康咨询、导诊和康复提醒。
可信数据空间的关键,是让数据在安全合规前提下发挥价值。苏州探索“红区、蓝区、绿区”分区管理机制:原始数据严格管控,脱敏脱密数据在专网环境中使用,样本和仿真数据可用于更开放的场景。这样做的目的很清楚:保护隐私是底线,释放价值是方向。

从“建数据”到“用数据”
关键看场景落地
医疗健康数据最终要回到临床、科研和患者服务中。苏州大学附属第一医院信息处处长程思民介绍,苏大附一院依托血液系统疾病国家临床医学研究中心大数据平台,建设血液相关6大专病库,并在此基础上推进高质量数据集建设。这些数据集已经用于患者预问诊、缩短问诊时间、辅助临床诊疗、疾病质控和科研转化。
对患者来说,变化可能体现在细节里。比如,预约挂号后,系统可以根据专科高质量数据集进行更专业的预问诊,提前采集医生真正需要的信息,减少门诊沟通成本,也让医生更快抓住病情关键。
中国科学技术大学生物医学工程学院创始执行院长周少华认为,江苏在医疗健康数据汇聚和信息化方面基础较好,下一步可以围绕医学影像、病理等医疗健康领域专用数据,推动基础模型训练,把“人工智能+医疗健康”落到更具体的场景中。
医疗AI的热度已经从概念讨论进入落地阶段,要真正服务医生、服务患者、服务产业,靠的是一整套数据治理、标准建设、安全流通和场景验证的体系。江苏把政府、医院、高校、科研机构和企业聚到一起,讨论的正是这件基础但关键的事:让医疗数据在守住安全底线的前提下,真正变成改善健康服务的能力。
“医学界” 正面向全国征集
基层医疗创新实践案例
如果您身边有值得推广的基层优秀实践
或您所在机构有创新成果希望展示
欢迎积极推荐或自荐
一经入选,将获得 “医学界”
官方专访与全平台展示机会
让您的创新实践被更多同行看见!
扫码投递案例
↓↓↓


医学界县域领域交流群正式开放!
长按识别二维码
加入我们吧!

来源:讯飞医疗


点击查看更多基层大事
↓↓↓
夜雨聆风