聚类分析及其在基因表达数据中的应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hellstone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因微阵列技术使得人们可以同时监测成千上万个基因的表达水平。目前对基因表达数据进行分析的各种方法中,聚类分析方法应用得最多。常用于基因表达数据分析的聚类方法有很多。与聚类相关的问题的有数据预处理、相似性度量、聚类有效性等。针对基因表达数据的特点,考虑到一些聚类算法的优缺点,重点介绍了两种基因表达数据聚类分析模型。一种模型是基于有效性测度谢白尼指数的基因表达数据的模糊聚类分析。它采用了一种适合于模糊聚类的聚类有效性测度谢白尼指数来衡量相同聚类个数情况下不同的聚类结果,并以谢白尼指数为标准来决定该基因表达数据集应划分为多少个聚类。将该种模型运用于公开的白血病基因表达数据集进行实验,实验表明该方法能自动获取基因表达数据的聚类数,并得到较高的分类准确率。另外一种模型是基于有效性测度的自组织映射与k均值方法相结合的一种基因表达数据聚类模型。考虑到自组织映射网络结点的聚类边界并不明显,它采用K平均值方法解决这个问题。另外,由于自组织映射聚类结果受到结点初始值和样本学习顺序的影响,每次聚类结果并不完全一致,本模型采用一种适用于普通聚类的聚类有效性测度斯路艾特指数来衡量不同的聚类结果。将该种模型运用于公开的白血病基因表达数据集和结肠基因表达数据集,取得了比较理想的实验结果。
其他文献
超声图像诊断是与X线CT、同位素扫描、核磁共振等一样重要的医学图像诊断手段。超声检查能够无损、直观地显示人体脏器的形态结构,能实时地观察人体脏器的功能活动而且操作简
随着计算机科学技术的发展和普及,特别是计算机在国民经济中的广泛应用,作为计算机灵魂的软件在社会生活中,尤其是在现代企业中得到广泛的应用。拥有优秀的跨平台特性的Java
本文对汉语术语的抽取进行了一定的研究,设计了一个统计方法和规则方法相结合的汉语专业领域术语抽取算法,并具体实现。在本文的实验系统DSTES中,共有四个核心模块:预处理模块,对
作为支持向量机和神经网络应用研究的重要补充和发展,针对目前用于生产生活的监视、监控系统的广泛重视,本文提出了基于视频图像的MPEG4 压缩方式和支持向量回归与径向基函数
计算机技术的迅猛发展使得人们创作、使用数字多媒体作品变得越来越容易,并由于互联网技术的发展又极大的推动了数字多媒体作品的广泛传播,一幅好的数字多媒体作品可以在一夜之
本文介绍了目前在国内电信业发展迅速的PHS无线市话网络和它的GIS体系结构和特点,介绍了PHS GIS系统的建立过程和GIS系统在PHS网络中全方位的应用,说明了GIS相比传统DBMS系统在
序列模式挖掘是指挖掘相对于时间或其他模式出现频率高的模式,是数据挖掘的一个重要分支。在交易数据分析,病症分析,Web日志分析,天气预报等领域具有广泛的应用前景。 本文选
近年来,随着全国煤矿企业加大煤矿开采力度,煤矿事故也逐年增加。作为我国西南地区的煤矿重镇,重庆南川煤矿辖区内各大中型煤矿也发生了多次矿难,不仅扰乱了南川矿区的正常生
随着车载自组织网络的快速发展,出现了一系列引人注目的车载应用。但由于车辆节点的高速移动,车辆之间很难维持稳定的网络连接,传统的MANET中的路由协议已经不能够充分满足VANET
OLAP技术是决策支持系统中的一种重要技术,用于管理人员决策分析。为了提高响应速度,需要对数据立方进行预计算。数据立方的计算在数据仓库中是非常必要但代价很大的操作。有