论文部分内容阅读
目的:使用增强CT图像的纹理特征,利用纹理分析及机器学习算法鉴别胰腺导管腺癌(PDAC)、胰腺神经内分泌肿瘤(PNETs)及胰腺实性假乳头状肿瘤(SPT),并回顾性评估纹理特征的诊断效能。材料与方法:本研究为回顾性研究,共纳入199例经病理证实的胰腺肿瘤,包括98例PDAC、62例SPT及39例PNETs,所有病人都进行了胰腺CT平扫+增强扫描。在胰腺动脉期的图像中手动勾画出肿瘤边界并提取纹理特征,本研究共提取46个纹理特征。本研究使用一对多的分组方法。单因素分析中,分别比较不同肿瘤的每个纹理特征,并计算曲线下面积(AUC)。多因素分析首先使用基于随机森林算法选择出对鉴别不同肿瘤有意义的特征组合,利用六种不同的机器学习方法(线性判别分析、K邻近、随机森林、Adabost、朴素贝叶斯、神经网络),将选择出的特征组合输入六种机器学习模型对肿瘤进行分类,基于十折交叉验证计算曲线下面积(AUC)或者分类准确率。AUC评估能力分5个级别:0.50-0.59,差;0.60-0.69,中等;0.70-0.79,较好;0.80-0.89,非常好;0.90-1.0,极好。结果:在单因素分析中,灰度区域大小矩阵特征中的低密度短域补偿对鉴别PDAC表现出较好的鉴别能力,AUC值0.7345(P<0.0001);灰度游程长度矩阵特征中的灰度不均一性对鉴别SPT表现出较好的鉴别能力,AUC值0.7900(P<0.0001);灰度共生矩阵特征中的总和均值对于鉴别PNETs表现出非常好的鉴别能力,AUC值0.8930(P<0.0001)。多因素分析使用随机森林算法提取出对鉴别有意义的特征组合后,六种机器学习算法对鉴别PDAC、SPT和PNETs的最大AUC值分别达到了0.8819(随机森林算法)、0.8583(随机森林算法)、0.9390(Adaboost算法),鉴别能力都达到了非常好或者极好的程度。六种机器学习算法直接多标签分类三种肿瘤后,分类准确率达到了80%(随机森林算法)。结论:基于胰腺增强CT图像的纹理特征非侵入性的鉴别PDAC、SPT和PNETs是可行的,且使用机器学习方法后能进一步提高鉴别诊断的效能。