
近日
深圳罗湖举行了一场
医疗语料成果发布会
发布会依次介绍
首批体检健康、体重管理、超声医学影像
等三大专项语料库建设成果
并发布了
《罗湖区医疗语料库使用管理规则》
对于非专业关注数据要素
或人工智能领域的人来说
“医疗语料”
这四个字或许颇为陌生
它究竟是什么?
与普通民众的看病就医
又有什么关联?

什么是医疗语料库?
今天人们热议的AI看病、AI读片、AI开方,背后都依赖一个核心环节:训练。
AI并非天生就会识别病灶,它要像学生一样反复“刷题”,它刷的题目就是语料。
对于医疗AI而言,一份合格的语料绝不仅是某张CT片子或某份化验单,而是一份经过专业医生标注、解释、结构化处理的高质量数据。
罗湖此次发布的,正是三种面向不同医疗场景的高质量语料库——体检健康、体重管理和超声医学影像。
罗湖区委常委、副区长冯健介绍,这三大语料库的建成,意味着深圳第一次有了区级层面主导、系统化建设、配套制度同步推出的临床级医疗语料资源。
罗湖区政务服务和数据管理局局长曾德怀用了四个关键词概括这批语料的共同特点:全量汇聚、全科精标、全链孵化、全程可控。
全量汇聚,是指数据规模庞大。三大语料库累计完成隐私脱敏数据超过4000万条,为大模型训练提供了兼具广度与深度的支撑。
全科精标,强调标注的专业性。所有语料都在三甲医院主任级专家的牵头下制定规范,由执业医师团队具体执行,确保数据标准统一、医学逻辑严谨。
全链孵化,意味着语料库不仅服务于单一模型的训练,还可以为临床诊疗、科研探索、跨场景迁移学习提供一体化服务。
全程可控,直指数据安全的红线。所有语料均经过全流程隐私脱敏和标准化处理,做到数据“可用不可见”,使用行为全程留痕、可追溯。
三大语料库能帮什么忙?
那么,这三大语料库能给市民看病就医带来什么改变?曾德怀现场介绍,答案藏在各自的定位中。
1
体检健康语料库
定位为“全民健康的数字档案库”
很多人做完体检,报告看不懂但也没人指点。罗湖的体检语料库整合了22万份原始体检报告,深度融合临床门诊、住院、病理、检验、检查等8大方面、124个维度的医学信息,形成超2万份高质量、标准化的体检语料。
它的价值在于,可以训练AI模型,精准捕捉不同人群的健康变化规律,评估未来慢病风险并给出干预建议,推动医疗服务从“治病”向“防病”转变。
2
体重管理语料库
定位为慢病防治的“精准干预库”
当前,减重领域普遍存在“千人一方”的困境,效果很不理想。而事实上,不同体质、不同病因的人的减重策略截然不同。
为此,罗湖构建了超2000例覆盖全流程的闭环数据,形成从评估到跟踪的完整闭环。依托它训练的AI减重模型,可以分析个体是代谢还是饮食问题,适合运动干预还是饮食调整,量身定制方案,提升减重成功率。

3
超声医学影像语料库
定位为“临床诊断的智能辅助库”
超声检查在基层医疗机构中应用极为广泛,但它的准确性高度依赖医生的经验。罗湖从3万例原始超声影像数据中精选了2000例典型影像,由具备5到10年临床经验的中高级医师团队进行专业标注和审核,全面覆盖正常及各类异常典型征象。
训练出的AI超声辅助模型可帮助基层医生精准识别病灶,让社康中心的B超检查也有“AI专家”辅助读片,大大降低漏诊和误诊的概率。
如何让数据流转?
发布语料库只是第一步,让数据真正被用起来、流转起来才是关键。在发布会现场,与三大语料库同时亮相的还有《罗湖区医疗语料库使用管理规则》。
这套规则的核心逻辑是分类申请、全程合规、成果可带:
分类申请:科研机构和人工智能企业走不同通道。科研机构向区卫生健康局申请,企业向行业主管部门申请。
全程合规:坚持数据不出域,对“谁在用、用多少、怎么用”做到全流程可追溯。所有数据使用行为均有日志记录,确保合规审计有据可查。
成果可带:原始语料不出空间、不落地、不复制,企业完成模型训练后只能导出模型成果,带走的是算法能力,留下的是数据安全。

曾德怀表示,这种设计既保障了数据安全,又保护了企业的商业价值,真正实现了“用得好也要管得住”,让企业和科研机构在合规框架下安心用数、放心创新。
在签约环节,罗湖区科技和工业信息化局与智城软件、迈瑞医疗、至知创新研究院首批三家生态伙伴完成医疗语料供数签约。罗湖区政务服务和数据管理局与深圳数据交易所达成医疗语料流通战略合作。
迈瑞医疗是医疗器械领域的龙头企业,智城软件是智慧城市基础设施运营商,深圳数据交易所是数据合规流通的专业平台。多方合力,覆盖了从技术研发到场景落地再到合规流通的完整链条,让医疗数据从“存着”到“用起来”一路通畅。




为什么是罗湖?
那么,这件事为什么是罗湖率先来做?答案藏在罗湖的两个独特优势中。
第一个优势是深厚的医改积淀。
罗湖是全国最早启动医联体改革的区域之一,成立了罗湖医院集团,持续将医疗重心向基层延伸。
这意味着罗湖手里掌握着大量一线临床数据。从医院到社康中心,从体检到住院,从超声到病理,这些数据长期分散在各级医疗机构中,处于“沉睡”状态。
第二个优势是数据要素市场化改革。
罗湖在全市率先启动医疗语料中心建设,与深圳市人民医院、罗湖医院集团联合规划了涵盖病理、体检、超声影像等八个方向的高质量数据集。
经过六个多月的集中攻关,首批三大语料库率先落地,病理、放射质控、CT、DR等其余五大语料库也在加速标注。
选择医疗领域作为切入口,在于医疗数据原本分散,而市场上对高质量医疗语料的需求最为迫切。与此同时,医疗语料的开发既能促进产业发展,又能辅助诊疗、助力慢病管理,让优质医疗资源以更低的成本触达更多居民。
对于一家AI医疗创业公司来说,能获取高质量、经过专业标注的临床数据,意味着握住了发展先机。
现在,罗湖敞开了大门
诚邀全国AI医疗企业
与科研机构前来共拓蓝海
携手将“数据燃料”转化为产业动能
在“AI+医疗”的新赛道上稳步前行
全力推动
“数据+算法+场景+产业”
的深度融合
打造全国数据要素
市场化配置改革的“罗湖样板”
统筹整合:罗湖发布
如需转载,请注明以上内容






夜雨聆风