面向疾病诊断的模糊聚类算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:weiqiangting
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医学信息技术的迅猛发展,数据挖掘技术在疾病辅助诊断方面发挥了巨大的作用。模糊聚类作为数据挖掘技术中重要的聚类技术,主要用于识别度量数据内在结构的相似性,是医学信息领域的研究热点之一。模糊c均值聚类(Fuzzyc-means Clustering,FCM)算法作为模糊聚类中的经典算法,在医学信息研究中也得到了广泛的运用。由于医学数据信息特殊性和传统FCM聚类算法的局限性,使FCM在医学疾病辅助诊断上以处理医学图像为主。本论文针对医学信息数据的混合属性特点,在对传统的FCM聚类方法改进的基础上,运用改进的FCM算法用于辅助医生开展疾病诊断。本文的主要工作概述如下:  (1)在fuzzy c-means聚类算法基础上,提出了一种面向数值属性和分类属性数据的混合模糊c均值聚类算法(Fuzzy c-means Clustering Algorithm for Mixed Data,MD-FCM)。在该方法中,分别使用均值和模糊质心代表数值属性和分类属性数据的初始化簇中心,并针对不同属性的数据分别运用不同的相异度测算方法来评估数据对象和簇中心之间的距离,实现对混合属性医学数据集的聚类,通过实验对MD-FCM聚类算法进行论证。  (2)在面向混合属性医学数据的fuzzy c-means聚类算法的基础上,提出了一种基于最小距离的簇中心初始化方法(Improved Centers Initialization of Clustersbased on Minimum Distance, MD-ICI)。 MD-ICI方法运用最小距离原则,结合相似性阈值思想,具有较高的收敛性。UCI(University of Californialrvine)机器学习库中的Heart Disease实验结果表明簇中心初始化方法MD-ICI比随机的簇中心初始化更有效。  (3)在面向混合属性医学数据的fuzzy c-means聚类算法的基础上,提出了一种加权模糊c均值聚类算法(Weighted Fuzzy c-means Clustering Algorithm for MixedData,MD-WFCM)。该算法在传统加权FCM算法的基础上,分别对数值属性和分类属性采用不同的权重计算方法,运用单目标优化问题计算数值属性的权重,利用分类属性距离作为分类属性权重方法来体现不同属性在聚类过程中的作用。  (4)在面向混合属性医学数据基础上,对簇中心进行初始化,并结合加权属性,提出了一种多层加权模糊聚类算法(Multiple Weighted Fuzzy c-meansClustering Algorithm for Mixed Data,MD-MWFCM)。采用FCM聚类算法框架算法得到第一阶段聚类簇中心,作为第二阶段初始聚类簇中心。在第二阶段运用针对数值属性和分类属性的混合属性加权c均值聚类算法(MD-WFCM)进行诊断。
其他文献
该文深入系统地研究了硼镁铁矿块的固结机理,并在已有研究的基础上,探索和开拓了含硼含镁复合添加剂.用五因子回归正交设计法对BO-MgO-SiO-CaO-FeO五元系固结块的抗压强度和
钒钛磁铁矿作为我国的特色冶金资源,是炼铁、提钒、生产重要的战略金属钛和制造钛白粉的原料,具有很高的综合利用价值。我国钒钛磁铁矿属于典型的低品位、多元素类质同象共生矿
目的:根据临床检验信息系统的发展现状和存在问题,该课题主要研究内容为:1、研究和解决自动化检验设备的通用数据采集接口问题.2、建立实用、简便、能适应单机和各种网络平台
该文采用通电溶出的方法处理普铝矿和碱液的混合物,在研究其溶出过程的同时对溶出机理也进行了初步探讨.钛矿物主要是锐钛矿在通电溶出时的行为也得到了研究.试验结果表明在
论文结合真空冶金工艺过程,用热力学分析方法研究二元及多元液态金属溶液的热力学性质、压力对含气相体系相平衡的影响及其应用.评述了相图和相平衡测定和计算方法、热力学理
该论文研究工作主要分为电沉积理论、工艺研究和模式识别、人工神经网络在电化学领域的应用两部分.
学位
在生活节奏越来越快的今天,运动、工伤、交通事故和疾病等原因引起的骨组织损伤,不仅严重地影响了人们的日常出行和健康生活,更是临床医学面临的重大挑战。一般而言,临床上使用的
该文从材料角度入手,选择了力学性能和耐氧化性能都较好的新型氟碳化合物封端的聚碳酸酯聚氨酯材料作为葡萄糖传感器的酶膜材料.研究了氟碳化合物封端的聚碳酸酯聚氨酯材料的
学位