您的当前位置:淋巴管瘤 > 病种常识 > 影像组学方法在软组织肿瘤中的应用研究进展
影像组学方法在软组织肿瘤中的应用研究进展
影像组学方法是医学影像学、计算机视觉和机器学习等多学科交叉的产物,能在宏观影像水平间接反映肿瘤微观水平基因或蛋白质的变化,并且不完全依赖于影像医师的专业技能、临床经验及主观因素,所提供的是医学影像相对客观的定量信息,具有传统影像方法难以做到的独特优势。对于软组织肿瘤而言,肉眼从影像上获取的信息十分有限,明确诊断非常困难,而影像组学方法可以辅助影像医生对其进行诊断,进而帮助影像医生和临床医生更全面、更深入、更透彻地认识和理解软组织肿瘤。本文介绍了影像组学方法在软组织肿瘤中应用研究的流程,并对目前影像组学方法在软组织肿瘤良恶性鉴别、术前预测软组织肉瘤分级、评价软组织肉瘤治疗及预后方面应用研究的进展进行综述。
软组织肿瘤;影像组学;人工智能
软组织肿瘤(softtissuetumors,STTs)是一组起源于中胚层间充质组织(如黏液、纤维、脂肪、平滑肌、滑膜、横纹肌、血管和淋巴管等)中多能干细胞的肿瘤,成分复杂且种类繁多,临床、影像及病理表现各异[1]。软组织肿瘤的治疗以手术切除为主,对于软组织肉瘤必要时还需辅以放化疗及靶向治疗,准确的影像学诊断是临床制定治疗方案的重要依据,手术前运用影像学检查对肿瘤进行全面评估具有重要意义[2]。MRI检查具有较高的软组织分辨力,其凭借多序列、多参数成像的特点可以更清晰地显示肿瘤的大小、形态、内部信号、边界以及肿瘤对周围组织侵犯情况,已经成为软组织肿瘤病变检出、确定起源、良恶性鉴别诊断、侵袭范围评价和判断有无复发等方面最重要的临床检查方法和术前诊断依据[3]。
人工智能是一项用于研究并模拟人类思维与能力的新技术[4]。医学影像与人工智能的结合始于上世纪60年代,自上世纪80年代以来,随着基于人工智能的计算机辅助诊断软件的使用,人工智能开始逐渐整合到影像科的日常工作流程中,如肺结节和肺癌筛查、乳腺结节和乳腺癌筛查等[5]。影像组学(Radiomics)方法即是人工智能技术在医学影像学领域应用的成果,Radiomics的前缀Radio意为影像,而后缀Omics则源于分子生物学,用于描述生物大分子的详细特征,如基因组学和蛋白质组学等;年,该后缀Omics被Lambin等[6]首次用于医学影像学研究领域,Radiomics一词便应运而生,后由Kumar等[7]于同年进行了补充和完善,定义为“高通量地从医学影像中提取并分析高级、定量的影像特征来深层次反映肿瘤组织的空间异质性特征”。
影像组学方法是医学影像学、计算机视觉和机器学习等多学科交叉的产物,能在宏观影像水平间接反映肿瘤微观水平基因或蛋白质的变化,并且不完全依赖于影像医师的专业技能、临床经验及主观因素,所提供的是医学影像相对客观的定量信息,具有传统影像方法难以做到的独特优势[8]。对于软组织肿瘤而言,肉眼从影像上获取的信息十分有限,明确诊断非常困难,这时就需要使用影像组学方法来辅助影像医生对其进行诊断,进而帮助影像医生和临床医生更全面、更深入、更透彻地认识和理解软组织肿瘤。本文就目前影像组学方法在软组织肿瘤中应用研究的进展进行综述。
影像组学方法在软组织肿瘤中应用研究的流程
影像组学方法在软组织肿瘤中应用的流程分为5个步骤:确定研究目标、软组织肿瘤影像的获取、软组织肿瘤病灶的分割、软组织肿瘤影像特征值的提取与降维、软组织肿瘤影像组学模型的建立[9]。
1确定软组织肿瘤研究目标
准确地寻找并确定研究目标是软组织肿瘤影像组学研究的关键,在确定研究目标后才能借助影像组学方法从软组织肿瘤影像中提取多维度特征以探索其与软组织肉瘤分级、软组织肿瘤良恶性、软组织肉瘤治疗及预后的相关性[10-12],因此软组织肿瘤影像组学研究需要紧密的医工交叉与结合来设计合理的研究方案。
2软组织肿瘤影像的获取
在软组织肿瘤影像组学研究的过程中,影像特征的可重复性、稳定性是十分重要的,扫描设备、扫描参数以及重建方式等都会对软组织肿瘤影像特征的稳定性造成影响,因此在获取软组织肿瘤影像前需要建立影像检查与处理的标准流程,保证扫描设备、扫描参数的一致性,减少外界因素对结果带来的误差,使影像组学特征更加稳定,从而获得精准的特征值分析与建模结果[13]。目前,大部分软组织肿瘤影像组学研究使用的均为同一检查机器及固定的检查参数[9-10,14-18],但也有部分研究使用了不同机器及不同检查参数[12,19-21]。
3软组织肿瘤病灶的分割
准确地对软组织肿瘤病灶进行识别与分割在软组织肿瘤影像组学研究中至关重要。在采集了大量标准化的软组织肿瘤影像数据后,需使用手动、半自动或全自动图像分割方法对软组织肿瘤病灶进行分割,其中手动分割具有主观性,准确性较高,但可重复性较差,建模结果会受到不同医生对影像解读方式的影响[22]。在半自动和全自动分割领域,ITK-SNAP、3DSlicer和ImageJ等软件的应用较为广泛,ITK-SNAP由宾夕法尼亚大学开发,其提供了基于主动轮廓的半自动分割方法[23],在软组织肿瘤影像的半自动分割中已经得到应用[14,24];3DSlicer由美国国家卫生研究院开发,提供了多种分割方法,如基于区域生长、基于模板、基于交互和基于统计等,在软组织肿瘤影像的半自动分割中也已得到了应用[17]。另有研究表明,基于3DSlicer的半自动分割方法与手动分割方法相比具有更佳的可重复性[25-26];ImageJ是一款基于JAVA的图像处理软件,已被应用于影像组学鉴别脂肪瘤与脂肪肉瘤的研究之中[20]。半自动及自动分割方法的优点是高效且重复性高,但使用其分割的兴趣区相对于手动分割的兴趣区精确度会有偏差,对于边界不清晰的软组织肿瘤可采用手动分割方法;而对于边界清晰且形态规则的软组织肿瘤,半自动或全自动分割方法高效且重复性高,能够满足海量数据分割的要求[27]。病灶影像的精准分割是软组织肿瘤影像组学分析的前提,但影像的伪影及软组织肿瘤对周围正常组织的浸润会导致病灶边缘显示不清,致使病灶影像的分割存在一定难度。目前,分割精确度高且重复性好的病灶影像分割算法还有待开发与研究。
4软组织肿瘤影像特征值的提取与降维
软组织肿瘤影像特征值的提取是使用计算机算法在像素水平上将软组织软组织肿瘤影像数据转化为大量量化的影像特征值数据再进行分析,是软组织肿瘤影像组学研究的核心步骤[9]。不同软件或平台计算特征值的方法各不相同,特征值可以分为如下几类,即一阶统计形态学特征、二阶统计特征、高阶统计特征、基于模型和基于变换的特征。
一阶统计形态学特征主要包括病灶的大小、形状等,也称为语义特征,主要量化像素值的分布规律而不考虑其空间分布关系,其指标包括平均灰度值、标准差、熵值等[28]。二阶特征即纹理特征,主要量化兴趣区内相同灰度或像素强度间的空间关系,指标有灰度级共生矩阵、灰度级长度矩阵、灰度区域大小矩阵等,间接反映病变的异质性,相当于二维直方图,多用于模式识别中[28]。
高阶特征是利用邻域灰度差矩阵计算高阶统计量,研究三个或更多体素间的空间关系,包括邻域灰度差值矩阵和灰度区域大小矩阵灰度级形状矩阵等。基于模型和基于变换的特征是将提取的图像特征进行滤过,常用的滤过包括基于拉普拉斯算法的高斯滤过、Gabor滤过、小波变换及分形维数变换等[29]。
勾画的软组织肿瘤兴趣区经过特征值提取后可获得成千上万的特征,这与原始数据的样本量相差悬殊,会导致模型的过拟合,因此模型的建立有赖于病变主要特征值的降维分析。目前,常用的降维算法包括方差选择法、单变量选择法及最小绝对收缩和选择算子等[22]。
5软组织肿瘤影像组学模型的建立
软组织肿瘤影像组学模型的建立需要通过大数据的机器学习来完成,机器学习是使用程序代码让计算机模拟或实现人类的学习行为,达到获取新知识或技能的目的。需要指出的是,机器学习的概念在上世纪60年代就已经被计算机科学家提出[30],但机器学习技术于近十年才开始被应用于医学影像领域。机器学习的方法包括:无监督机器学习、半监督机器学习及监督机器学习[29]。
无监督机器学习是对数据采用热点图分析或聚类分析,挖掘数据的自然结构特征,不预设数据标签。
监督机器学习则需要设置数据标签来训练模型,常用的监督机器学习算法包括支持向量机(supportvectormachine,SVM)、随机森林(randomforests,RF)、决策树(decisiontree,DT)和逻辑回归(logisticregression,LR)等,其中SVM由Cortes等[31]于年提出,一般应用于二分类问题当中,具有相对优良的性能指标,是建立在统计学理论基础上的机器学习方法,能够寻找出区分度较高的支持向量,可以最大化类与类的间隔,因此具有较好的适应能力和鉴别能力,在软组织肿瘤影像组学研究中得到了广泛的应用[9,11-12,14,19]。SVM只需由各类域边界样本的类别来决定最后的分类结果,其优点是不依赖全部样本数据就可以解决高维度问题,缺点是核函数的确定有一定难度,且核函数的选择会影响分类结果[30]。RF是由Breiman[32]于年提出的一种利用多个树分类器进行分类和预测的方法,其输出类别由单个树输出类别的众数而定,通过随机方法建立一个由很多棵无关联决策树组成的森林,在输入新样本时森林中的每一棵决策树会对其分别进行判断,最终根据相对多数投票法即该样本被选择最多的分类给出其分组,RF在软组织肿瘤影像组学研究中也有应用[9,11-12],该算法以能够降低过拟合现象为优点,但其不能较好地预测超越训练集外的数据[30]。DT因其输出结果类似一颗倒置的树而得名“决策树”,本质上可看作一个树状预测模型,通过将实例从根节点排列到某个叶子节点完成分类。DT在软组织肿瘤影像组学研究中也有应用[19],其优点是计算省时,缺点是易出现过拟合现象[30]。LR的基本原理是将标记好的数据通过机器学习总结归纳得出分类模型或分类决策函数,通过输入离散或连续变量对输出结果进行分类,其缺点是当特征维度很大时该模型的准确性不佳[33]。LR在软组织肿瘤影像组学研究中亦有应用[12,14,20]。
半监督机器学习则介于无监督机器学习和监督机器学习之间,通过使用大量未标记的数据和少量标记的数据来对模型进行训练,主要用于类别标签不明确的数据[34]。
不论使用何种机器学习方法,均需对比训练集及验证集的受试者操作特征曲线(receiveroperatingcharacteristic,ROC)的曲线下面积(areaundercurve,AUC)、敏感度、特异度、符合率、召回率及和F1-Score等指标来评价机器学习模型的诊断效能及稳定性。
影像组学方法在软组织肿瘤中应用研究的进展
作为一种新兴的医工结合手段,影像组学方法用于软组织肿瘤的研究与传统软组织肿瘤影像研究的不同之处主要体现在传统影像手段仅能通过兴趣区测值的方法来间接反映软组织肿瘤的局部信息,无法反映软组织肿瘤的整体情况,而影像组学方法则能提取软组织肿瘤病灶多个层面乃至全部层面的影像特征,从而对软组织肿瘤的异质性进行全面评估。
目前,影像组学方法在软组织肿瘤良恶性鉴别、术前预测软组织肉瘤分级、评价软组织肉瘤治疗及预后等方面都有应用研究。
1影像组学方法在软组织肿瘤良、恶性鉴别中应用研究的进展
软组织肿瘤的良、恶性鉴别一直是临床