摘 要:提出了一种基于胃镜图像的计算机辅助病灶检测方法。首先,引入超像素理论,将胃镜图像分割成大小均匀且包含相似像素的若干区域;然后,分别提取颜色特征和纹理特征,并将其融合作为特征描述符;最后,采用二级串联分类器进行胃镜图像内干扰区域的去除以及病灶区域的识别。实验结果表明,本方法病灶检测正确率(AUC)可达到91.588%。
关键词:病灶检测;颜色直方图;超像素;LBP
随着人类生活方式和日常饮食的改变,加之现代生活快节奏性与不规律性,胃肠道疾病的发病率越来越高。目前,胃部疾病的检测主要借助于电子胃镜。医学电子胃镜主要由内窥镜、视频处理器和视频显示器组成。应用电子胃镜可以采集到高分辨率的医学图像,如图1所示。临床医生可以灵活地操控电子胃镜来实时地观察胃镜的病变区域。尽管如此,由于诊断过程主要凭借临床医生的主观性,加之病理特征的多样性和胃部环境的复杂性,胃病诊断的误诊率和漏诊率仍居高不下。因此,研究与设计一种基于胃镜图像的计算机辅助检测系统十分必要。
就目前来看,此方面的研究主要集中在无线胶囊内窥镜图像上,其研究的焦点主要集中于小肠和结肠的病灶区域检测。而针对于传统胃镜图像的研究尚处于起步阶段,对于胃部病变的检测尚未形成一种有效的方法。纵观前人的工作,虽然检测方法多种多样,但可以粗略概括为图像预处理、特征提取和用分类器进行识别3个步骤。在图像预处理阶段,图像通常会被分割成小矩形块[1]或相互重叠的圆形区域[2];接下来,从分割后得到的区域提取各种不同特征,包括颜色直方图、局部二进制模式(LBP)和小波域共生矩阵特征等。在最近几年中,机器学习被广泛地应用到医学图像的病灶检测领域当中,例如支持向量机(SVM)[3]、贝叶斯推理和神经网络等。
前人方法的主要缺陷在于过少地考虑了干扰因素的影响,提取特征相对单一。针对以上问题,本文提出了一种新的基于胃镜图像的病灶方法。首先,运用超像素的思想将图像进行分割;然后,针对每一个分割后的区域,分别提取适合于排除干扰和识别病灶的组合特征;最后,采用二级串联分类器进行干扰区域的去除和病灶区域的识别。
1 本方法中的相关技术
胃肠道不同于人体其他器官,作为消化系统的一部分,它的生理环境十分复杂,其表面经常会被粘液、气泡和食物残渣等覆盖。除此之外,胃镜的光照条件也极大地影响了图像的质量。综合前人工作的分析可知,过多的噪声极大地影响了病灶区域的识别准确率。针对此种情况,本文方法在图像分割、特征提取以及分类器的设计上进行了相应改进。
1.1 基于超像素的区域划分
超像素在计算机视觉中得到了广泛应用,但是在病灶检测领域尚未得到应用。参考文献[4]提出了一种简单线性迭代聚集算法(SLIC)来减少计算量。相比较于归一化分割算法和快速漂移算法,该算法具有耗时短、超像素的尺寸和矩形度可调节的特点。
从实验结果可以看出,对于干扰区域,15维的HIS_I、30维的HSV_HV、15维的Normalized RGB和15维的Opponent颜色特征表现出色,其受试者工作特征曲线(ROC曲线)下面积均可达到97.32%、98.78%、97.62%和99.27%。对于病灶区域,45维的HSV_HV、30维的RGB、45维的RG、15维的Opponent特征表现良好,其ROC曲线下面积均可达到90.76%、91.19%、92.83%和91.68%。然而单一的特征其代表性也比较单一,在实际复杂的应用环境中仍达不到理想的效果,因此本文方法将多种特征进行融合,通过多种特征的叠加来加强特征的鲁棒性,从而可以应对复杂多变的应用环境,其实验结果如图2和图3所示。图2中,(1)表示HIS_I(15维)+HSV_HV(30维),NormRGB(45维)+OPPO(30维)+RGB(30维);(2)表示OPPO(30维)+LBP(15维);(3)表示OPPO(30维)+HUE(45维);(4)表示OPPO(30维)+HUE(45维)+LBP(15维);(5)表示所有单个特征表现最好的组合。图3中,(1)表示HIS_I(45维)+LBP(30维)+NormRGB(45维)+HUE(45维);(2)表示LBP(30维),NormRGB(15维)+RG(30维);(3)表示LBP(30维)+NormRGB(45-d)+RG(45维)+OPPO(15维);(4)表示LBP(30维)+RG(30维);(5)表示LBP(30维)+RG(45维)+OPPO(45维);(6)表示RG(45维)+OPPO(15维)+RGB(30维);(7)表示RG(45维)+OPPO(15维)+RGB(30维)+LBP(30维);(8)表示所有单个特征表现最好的组合。
实验结果证明,其组合后的特征性能平均高于任何一个单一特征,达到了预期效果。在干扰区域排除阶段,特征组合(2)(30维的Opponent颜色直方图串联15维的LBP纹理特征)表现最为突出,AUC达到99.50%。在病灶区域识别阶段,特征组合(5)(30维LBP纹理特征串联45维的RG和45维的Opponent颜色特征)表现出色,AUC达到93.34%。本方法最终采用以上两种最优特征组合方式,为后续的去除干扰和病灶识别工作奠定了基础。
1.3 分类器设计
Adaboost衍生于Boosting算法,自从Schapire提出以来得到了广泛的应用。Adaboost属于一种迭代算法,其核心思想是将多个弱分类器组合成一个强分类器。本文选取决策树作为子分类器,为避免过度学习的情况发生,本文将树的深度设置为2。其次需要确定算法迭代的次数,综合考虑算法的识别率及分类器的训练时间,最终确定迭代次数为60最为合适。
为减少胃镜图像中噪声对检测结果的影响,本文方法将两个Adaboost分类器串联起来,形成一个三分类器,通过此分类器,待检测区域将被识别为正常区域、干扰区域或病灶区域3类。其工作流程如图4所示。
2 方法实现
首先,采用超像素的思想将图像分割成像素相对紧凑一致的区域;其次,通过实验分别找出适用于干扰区域和病灶区域的特征的组合;最后,采用二级分类器完成干扰区域的去除以及病灶区域的识别工作。本文方法的整个流程下。
算法:
(1)设置期望的分割块数K及区域的矩形度m。
(2)在边长为S的区域内随机初始化起始聚集中心CK=[lk,ak,bk,xk,yk]T。
(3)采用3×3大小的邻域寻找梯度最小的点作为聚集中心点。
(4)repeat
(5)for对于每一个中心点CK do
(6)利用式(2),在中心点周围2S×2S范围内寻找与中心点最匹配的像素点。
(7)end for
(8)重新计算中心点的位置,并计算新中心点与前中心点位置坐标的欧式距离E。
(9)until E≤threshold
(10)将孤立存在的小区域强制划分到相邻的最大区域。
(11)for每一个分割后的区域do
(12)if区域内像素个数≥N then
(13)提取适合于干扰区域识别的特征组合。
(14)利用第一级分类器进行识别。
(15)if该区域被识别为干扰区域then
(16)提取适合于病灶区域识别的特征组合。
(17)利用第二级分类器进行识别。
(18)end if
(19)end if
(20)end for
3 实验与结果分析
3.1实验设计
本实验的数据来源于120个临床病例,共计3 000张医学胃镜图像,其中包含1 500张含有病灶区域的图像和1 500张完全健康的图像。图像的大小为489像素×409像素,存储格式为JPEG。每一幅含有病灶区域的图像都配有专业医师标注的标注图,在实验中作为地面真值。
在实验中,规定对于完全健康的图像,只要有一个区域被识别为病灶区域,则认为检测失败;反之,则认为检测成功。对于含有病灶区域的图像,只要有识别为病灶的区域与医生标注区域有重叠,则认为检测成功;否则,认为检测失败。
在实验中,采用4种不同的方法对相同一批图像进行检测,用来进行检测效果的分析对比。方法1,SLIC分割+组合特征+二级串联分类器;方法2,SLIC分割+组合特征+单级分类器;方法3:按30×30矩形分割图像+组合特征+二级串联分类器;方法4:按30×30矩形分割图像+组合特征+单级分类器。
3.2 实验结果与分析
本文采用ROC曲线对实验进行分析。ROC曲线将灵敏度与特异性以图示方法结合在一起,可以准确反映分析方法中特异性和敏感性的关系,是试验准确性的综合代表。在ROC曲线图表中,X轴表示假阳性率FPR(False Positive Rate),Y轴表示真阳性率TPR(True Positive Rate)。ROC曲线展示了当评判标准变化时这两个变量之间的相互关系。ROC曲线下方的面积可以用来评判一个系统性能的好坏[5]。
实验结果如图5所示,本文所提出的方法(方法1)的检测效果远好于其他方法,其正确率远好于其他3种方法,正确率(AUC)达到91.588%。方法2、方法3和方法4的正确率(AUC)分别为86.058%、76.458%和70.727%。
部分实验效果如图6所示,其中第1排为含有病灶区域的胃镜图像;第2排为临床医师给出的地面真值图;第3排为本文方法检测后的结果图。
医疗器械的限制以及胃部特殊生理环境的影响,使得有些病灶区域很难用肉眼识别。考虑到胃镜图像的成像质量受多方面因素的影响,图像噪声多的特点,本文方法在预处理阶段采用SLIC分割算法,将图像分割成大小均匀的超像素,相较于简单的人工划分区域,具有区域内像素更加统一和紧凑的特点。此外,本文方法还采用了多种特征组合的形式替代了单一特征。最后通过使用二级串联分类器将去干扰和病灶检测步骤串联进行。实验表明,本文方法的病灶检测正确率优于传统方法。
参考文献
[1] Liang Pan, Cong Yang, Guan Mo. A computer-aided lesion diagnose method based on gastroscope image[C]. 2012 IEEE International Conference on Information and Automation, ICIA 2012, Washington, DC. IEEE Computer Society, 2012: 871-875.
[2] SZCZYPINSKI P, KLEPACZKO A, PAZUREK M, et al. Texture and color based image segmentation and pathology detection in capsule endoscopy videos[J]. Computer Methods and Programs in Biomedicine, 2014,13(1):396-411.
[3] LI B, MENG M Q H. Tumor CE image classification using SVM-based feature selection[C]. Intelligent Robots and Systems (IROS), 2010: 1322-1327.
[4] ACHANTA R, SHAJI A, SMITH K, et al. Slic superpixels[J]. Ecole Polytechnique Federal de Lausssanne(EPFL), Technical Report, 2010: 149300.
[5] SWETS J A, DAWES R M, MONAHAN J. Psychological science can improve diagnostic decisions[J]. Psychological Science in the Public Interest, 2000, 1(1): 1-26.