uSense:CT AI专刊-01

深度学习算法在CT成像中的应用：从技术原理到临床整合

近年来，深度学习算法在投影数据校正、迭代重建优化、图像后处理等环节取得实质性进展。与通用型后处理工具不同，新一代算法呈现出任务专用化与流程嵌入化两个显著特征：一方面，算法针对特定解剖结构与特定伪影来源进行专门建模；另一方面，算法不再作为独立的后处理模块，而是与扫描协议、重建引擎深度整合，形成可配置的临床解决方案。uSense主动感知技术（uSense technology）系统化整合了多种深度学习算法，为应对复杂临床条件下CT成像面临的共同问题提供了系统化的解决路径，以下将以uSense平台中代表性算法为分析对象：首先梳理7项核心图像质量优化技术的背景、原理及创新点；继而分析2项临床扫描技术如何调用上述技术以重构检查流程；最后讨论该技术矩阵的临床价值及未来演进方向。

图像质量优化：核心算法梳理

1.1 深度学习冠脉最佳时相算法（artificial intelligence ePhase， AI ePhase）

1.1.1 技术背景冠状动脉CT血管成像（coronary CT angiography， CCTA）是常规心脏CT检查，冠状动脉（简称冠脉）显影清晰度是决定图像质量的关键。传统最佳相位重建高度依赖医师经验，需通过繁琐重建对比才能选出合适相位，且不同冠脉运动模式差异进一步增加了操作复杂性。因此，能够区分冠脉并自动选择特定感兴趣冠脉最佳相位的功能，可显著提升心脏重建工作效率。

1.1.2 算法原理 AI ePhase流程分为4个模块：①利用心电信号在所有心动周期内采集原始数据并进行多相位重建；②采用经过大量标注数据训练的深度学习网络，学习心脏及冠脉特有的形态学特征，可以定位心脏和冠脉位置，并进一步区分左、右冠脉；③可将冠脉显影质量这一主观感受转化为客观可以量化的指标；④根据前述得到图像质量，选择质量最高的相位并输出最终的最优重建的结果。见图1。

图1 AI ePhase流程图

1.1.3 创新特征通过深度学习网络精准定位并区分左、右冠脉，将冠脉显影质量量化为客观指标，实现对多相位图像的质量评估，并根据量化指标自动决策输出最佳相位重建结果，有效提升了心脏重建工作流程的效率与诊断可靠性。

1.2 深度学习冠脉运动校正算法（artificial intelligence CardioCapture， AI CardioCapture）/深度学习全心运动校正算法（artificial intelligence CardioCapture 2.0， AI CardioCapture 2.0）

1.2.1 技术背景减少心脏运动伪影并提高心脏扫描的时间分辨率是CT重建领域的热点话题。即使使用最高转速的CT扫描仪，心脏运动仍是冠脉疾病误诊的主要影响因素。因此，需要运动补偿方法来减少运动伪影。常用方法是在图像或投影数据中利用运动向量进行运动补偿，本算法提出对随时间变化的情况进行估计，并在重建中考虑这些变化。

1.2.2 算法原理流程分为4个模块。①图像前/后处理模块（可选）：此处是基于深度学习的心脏冠脉运动伪影校正算法；②冠脉中心线提取模块：采用经过大量标注数据训练的深度学习网络，学习心脏及冠脉特有的形态学特征，可以提取冠脉中心线，输出的是不同时相重建图像的冠脉中心线；③运动向量场计算模块：根据相邻时相提取冠脉中心线的相对空间位移，对2套冠脉中心线之间的空间运动进行插值逼近，最后得到相对密集的针对冠脉附近区域的运动向量场，在全心运动校正中，根据相邻时相特征图相对空间位移计算损失函数，采用梯度下降法获得心脏整体运动向量场；④校正重建模块：对用户选取的目标校正时相，对采集的数据进行分段重建；具体分段数量与多时相重建的时间点相对应，用不同时段采集的数据重建图像，使用对应的运动向量场进行运动扭曲校正，把所有分段图像叠加起来，得到校正输出图像。见图2。

图2 AI CardioCapture/AI CardioCapture 2.0流程图

1.2.3 创新特征将深度学习技术与物理解析算法相结合，通过深度学习端到端的校正提供预校正和后补偿，利用深度学习网络精确提取冠脉中心线；同时结合解析重建的物理特性，构建针对冠脉区域的密集运动向量场，有效校正冠脉运动伪影。

1.3 深度学习头部运动校正算法（Motion Freeze）

1.3.1 技术背景在头颈部CT检查中，神经损伤、脑出血、患者紧张等情况下常发生非自主运动，导致运动伪影降低图像质量。Motion Freeze旨在抑制头部运动引起的伪影，提升图像质量。

1.3.2 算法原理基于物理模拟生成训练数据集：对于无运动的三维头部CT图像，在虚拟采集过程中逐视角施加刚性运动，进行前向投影获得运动扰动的投影数据，经反投影重建得到含运动伪影的图像，与原始无运动图像构成配对训练样本。网络结构引入残差网络以保持空间分辨率，并采用空洞卷积扩大感受野的同时避免分辨率损失，有效提取运动伪影特征进行校正。见图3。

图3 Motion Freeze流程图

1.3.3 创新特征通过物理模拟生成配对伪影图像，构建可灵活控制运动模式的训练数据集。网络结构融合残差网络优势，引入空洞卷积，在保持空间分辨率的同时扩大感受野，从而在多尺度上有效捕捉运动伪影特征。

1.4 深度学习心脏图像重建算法(CardioBoost)

1.4.1 技术背景在心脏CT成像领域，滤波反投影（filtered back projection， FBP）使用低频滤波函数降噪，会牺牲空间分辨率，混合迭代重建中较高的迭代权重常导致图像呈“塑料质感”或“斑驳”现象，影响诊断。深度学习作为一种端到端的数据驱动方法，利用数据训练神经网络，使其能够自主学习数据规律与特征。通过使用典型临床影像进行训练，基于深度学习进行CT重建，CardioBoost使用三维卷积神经网络技术，能在抑制噪声的同时保持图像纹理的自然性，且在三维空间的均匀性和连续性更好；针对包含冠脉支架、钙化斑块等精细结构的影像进行训练，使算法能精准优化此类场景的图像质量。

1.4.2 算法原理 CardioBoost提供的是一个训练好的降噪网络，其训练流程见图4。算法训练数据集由正常剂量数据集和模拟低剂量数据集组成。每个训练迭代中，低剂量数据随机混合输入网络，前向传播后将网络输出与正常剂量数据比较，优化器将差异转化为模型参数梯度进行优化，采用损失函数监控训练过程，直至模型性能收敛。

图4 CardioBoost训练流程图

1.4.3 创新特征 CardioBoost数据集采用基于组织识别的分类方法，精准区分胸腹部等多种组织类型，包括斑块与心脏瓣膜。数据集应用专门针对支架、斑块及小血管的数据增强策略，显著提升算法在这些关键心脏结构中的性能。CardioBoost网络为基于三维深度学习神经网络架构，具备更强普适性、鲁棒性与精准度。相较于FBP，能显著降低图像噪声，在低剂量条件下实现高分辨率成像；相对于全模型迭代，重建速度更快，更适配典型心脏运动校正算法。

1.5 深度学习金属伪影校正算法（artificial intelligence metal artifact correction， DeepMAC）

1.5.1 技术背景金属伪影是CT扫描时金属植入物对X线强烈吸收和散射造成的影像异常，影响正常组织结构显示，掩盖病灶区域。传统插值校正方法常引入二次伪影，制约临床应用。现有深度学习算法性能高度依赖于训练数据质量与网络架构设计。常规做法通常将传统校正算法的结果作为金标准，但这类方法本身会引入二次伪影，导致网络学习目标存在偏差，在神经网络的输入上仅使用单张含伪影图像，限制了信息的利用。DeepMAC从数据集构建和网络结构两个层面优化：通过物理模拟射线硬化、光子饥饿等金属伪影成因，生成带金属伪影图像和对应高质量金标准图像；在网络结构上将预校正图像和原始含金属伪影图像作为输入，以金标准图像为学习目标，使模型学习更多金属伪影特征。

1.5.2 算法原理 DeepMAC采用双输入的网络架构，一方面引入经过预校正的图像，另一方面保留原始含金属伪影的图像，提供丰富结构特征。通过多层次的图像特征提取与融合，算法最终输出显著抑制金属伪影的校正图像，流程见图5。预校正通过正投影获取金属长度，基于能谱硬化信息采用多项式拟合与线性插值校正投影数据，反投影得到预校正图像。将原始伪影图像与预校正结果共同输入深度学习网络，使网络获取更丰富特征，从而输出更高质量图像，增强算法稳定性与鲁棒性。

图5 DeepMAC流程图

1.5.3 创新特征该算法有效融合基于物理模拟方法和数据驱动方法，解决了传统校正算法容易引入二次伪影的问题，弥补深度学习方法在构建数据集时金标准与金属伪影图像缺乏物理一致性的不足。通过模拟金属伪影构建高质量数据集，在算法结构中引入双输入设计，发挥深度学习特征提取能力，提升对不同部位和不同形态金属伪影的抑制效果。

1.6 深度学习全模型迭代算法（artificial intelligence iterative reconstruction， AIIR）

1.6.1 技术背景传统模型迭代重建通过考虑噪声统计和光学模型可降低噪声并抑制条状、锥束伪影，但其正则化项易导致图像纹理不自然，与FBP风格差异显著。近年深度学习方法多基于图像域降噪，难以从根本上解决噪声引入伪影的问题。AIIR在模型迭代重建框架中引入深度学习，以改进正则化降噪性能，融合两者优势。

1.6.2 算法原理 AIIR采用分步优化策略，每次迭代先最小化数据保真代价函数，再应用深度学习去噪模块抑制噪声和伪影，两者结合构成完整迭代（图6）。数据保真项充分描述系统过程，通过正向投影与实际采集数据比较，将差异加权反投影更新图像。深度学习去噪模块基于数百万对高质量/低剂量图像训练，涵盖多部位、多协议、多剂量及典型疾病，确保泛化能力与鲁棒性。

图6 AIIR流程图

1.6.3 创新特征 AIIR可更有效降低噪声，提升低对比度分辨力及低剂量下的图像质量，同时模型迭代重建也能随着迭代次数增加逐步优化图像细节，有助于低剂量下的细节恢复及高分辨结构显示。

1.7 胸腹联合扫描智能剂量调控（artificial intelligence dose modulation， AI DOM）

1.7.1 技术背景在胸腹联合扫描场景下，由于胸部和腹部对剂量和图像质量要求不一致，需要采用不同的剂量调制系数。传统临床胸腹联合扫描需分2个协议2次发射射线，胸腹交界区存在重复曝光；为避免重复曝光而采用单一胸部或腹部协议一次发射射线，则导致胸部剂量偏高或腹部剂量不足。需设计胸腹联合扫描智能剂量调制优化算法。

1.7.2 算法原理 AI DOM将深度学习器官识别与胸腹部剂量调制算法结合。首先采用深度学习算法对胸腹部定位像进行识别，给出胸部和腹部定位框及胸腹分界位置信息。剂量调制根据胸腹位置信息，采用胸部和腹部协议分别计算胸部和腹部剂量曲线，再将2条曲线平滑合并，通过一次发射射线完成胸腹联合扫描。见图7。

图7 AI DOM流程图

1.7.3 创新特征相较于传统剂量调制，能识别患者胸腹位置，分别计算剂量，实现胸腹联合扫描剂量调制优化，既避免重复曝光，又使胸腹剂量曲线与传统方式水平相当，扫描后图像质量相近。

临床扫描技术整合：工作流优化的技术路径与价值

2.1 无心电门控心脏扫描技术（CardioExpress）该技术的核心目标是在完全不依赖心电信号输入的前提下完成冠脉成像。在灵活的交互界面进行扫描，重建调用AI ePhase确定相位，再调用AI CardioCapture 2.0完成运动伪影控制，同时可以结合CardioBoost进行降噪和图像优化，进一步降低剂量。现有单中心研究显示，该协议可达到与心电门控相当的冠脉可评估率，同时显著简化检查准备流程，见图8。

图8 传统心脏扫描（A）和CardioExpress（B）工作流对比

2.2 动态可变螺距扫描技术（Dynamic Pitch）该技术针对经导管主动脉瓣置换术（transcatheter aortic valve replacement， TAVR）前规划的全心、全主动脉及外周血管成像需求进行专门设计。扫描层面采用可变螺距螺旋扫描策略，不同部位按照其适合螺距进行参数设定，按照参数调整床速进行可变螺距采集（图9），最后对采集数据使用对应的可变螺距重建算法输出大范围图像，确保大范围覆盖的同时减少不同协议之间的切换时间；重建心脏部位时可结合AI ePhase和AI CardioCapture保证图像质量；后处理层面可结合调用深度学习伪影校正算法以消除瓣膜及血管壁钙化所致的伪影干扰。该协议实现单次扫描完成冠脉、主动脉根部、主动脉全程及髂股动脉的同步成像，影像数据集可直接导入三维后处理软件进行瓣膜尺寸选择、投照角度规划及入路血管评估。见图9。

图9 Dynamic Pitch中的床速变化示意图

上述2项协议并非孤立的技术模块，而是对核心算法的可配置调用。同一套算法可根据临床目标的不同（心脏成像、TAVR成像）以不同组合方式激活，形成面向特定病种的解决方案。这种“算法即服务”的uSense平台化架构，是人工智能技术从单点工具向系统能力演进的重要标志。

展望

上述算法已完成技术可行性验证，在多中心临床研究中接受诊断效能评估，上述深度学习技术能够在不牺牲诊断信心的前提下降低辐射剂量或减少对比剂用量，整合协议则显示出简化工作流的潜力。然而，当前研究仍以单中心、回顾性设计为主，前瞻性、多中心证据链尚待补充。

当前算法多为任务专用模型，未来可向多任务统一模型演进，单一网络同时完成运动估计、降噪、伪影校正等多项任务，降低计算开销与部署复杂度。当前深度学习技术主要作用于重建及后处理阶段，下一步可前移至扫描规划阶段，基于患者特征（身高、体质量、心律、金属植入物状态）自动推荐最优扫描协议与剂量参数。基于解剖图像的冠脉CT血流储备分数、心肌灌注、斑块稳定性评估等功能学技术正逐步成熟，与上述算法结合有望实现形态学与功能学的一体化评估。CT成像正经历从“硬件定义性能”向“算法定义性能”的深刻转变。uSense平台意味着深度学习技术在医学影像领域的应用已跨越“演示性创新”阶段，进入“系统性赋能”阶段。最终价值不仅体现在单项指标的优化，更在于使高质量CT检查变得更普适、更可及、更贴近真实世界。

请关注

cjmit1985