【摘 要】
:
随着基因芯片技术的广泛应用,产生了海量的基因表达数据。如何分析和处理这些数据,从中提取有用的生物学或医学信息,是基因芯片技术应用的关键和难点。聚类分析能将功能相关
论文部分内容阅读
随着基因芯片技术的广泛应用,产生了海量的基因表达数据。如何分析和处理这些数据,从中提取有用的生物学或医学信息,是基因芯片技术应用的关键和难点。聚类分析能将功能相关的基因按表达谱的相似程度归纳成共同表达类别,有助于对基因功能、基因调控及细胞过程等进行综合研究。本文分析了基因表达数据分析中的常用聚类算法,指出了它们的优势和不足,其中模糊核聚类算法以其模糊性划分数据和处理非线性数据效果好的优点而被广泛应用于基因表达数据的分析。首先,从避免人为初始化聚类参数的角度出发,提出了一种自适应模糊核聚类算法。该方法依靠减法聚类来确定聚类数目的最小上限,并通过有效性函数测量聚类范围上不同类数聚类结果的有效性,选择其中的拐点或极值点作为最佳类数的预测,在算法的迭代过程中也实现了初始聚类中心的预测。利用基因表达数据进行测试,实验结果验证了该方法的有效性和可行性。其次,针对模糊核聚类算法容易忽略含有重要信息的离群基因的问题,提出了一种离群模糊核聚类算法。通过对每一个基因分配一个动态的权值,并在算法迭代中不断更新权值来发现离群基因,改善了聚类效果。利用公式推导证明了该算法具有收敛性。将自适应模糊核算法与离群模糊核聚类算法相结合,提出了一种自适应离群模糊核聚类算法,并利用酵母细胞基因表达数据对算法进行测试,仿真结果表明,该算法无论是在优化精度方面还是在优化效率方面,均较以往提出的模糊核算法在性能上有所提高。最后,设计并实现基因表达数据聚类分析系统,系统主要实现了基因数据的载入、数据的预处理、自适应离群模糊核聚类算法、聚类结果的可视化等功能。系统对基因表达数据进行实验,最终得到的聚类结果所反映的规律符合生物意义。
其他文献
目前,Java卡在国内市场虽然所占的份额还很小,但是未来的趋势正朝着有利于Java卡的方向发展。而且国内一些具有前瞻性的卡商也开始着手进行Java卡的开发,在GP(Global Platform)
随着我国铁路事业的发展,对钢轨进行表面缺陷在线检测的问题日益突出。由于钢轨存在大量的表面附着物,无法基于钢轨图像的灰度值准确的对钢轨表面进行检测。基于结构光的机器视
科技的进步与社会的需求推动了高性能计算技术的出现与发展,而在科学计算领域,随着问题规模与复杂度的不断增加,人们对大规模计算的要求也急剧增长。当前,一般通过提升集群模式下
人脸检测肩负着在一幅输入图像中搜索并确定人脸是否存在以及如果存在,确定人脸位置和大小的任务。本文针对当前主流的基于统计学习和瀑布型分类器检测框架的人脸检测方法,在收
在高性能计算领域,数据流是一类重要的计算结构,也在很多实际场景表现出很好的性能和适用性。在数据流计算模式中,程序是以数据流图来表示的。数据流计算中一个关键的问题是如何
随着电子科学技术的不断发展和网络的进一步普及,图像资源逐渐成为人们获取和利用的一类非常重要的资源,从而推动了图像标注与检索技术的不断发展。图像数据是材料科学数据中一
随着以太网技术的迅猛发展,网络规模越来越大,对网络用户的管理和计费需求提出的要求也越来越高。交换机是以太网建设的基础设备,利用交换机的802.1x认证功能对网络用户进行管理
随着软件规模的不断扩大,人们变得越来越重视保证软件的质量和可靠性。软件测试是保证软件质量和可靠性的必要手段,软件测试研究领域的核心内容之一是测试用例生成方法。如何通
多智能体系统协作机制是当今多智能体理论中的热点问题,网络环境下基于协进化机制的多智能体协作方法作为一种新兴的研究思路,具有广阔的研究前景,它在远程多智能体协调与控制方
蓝牙技术是一种无线数据与语音通信的开放性全球规范,它以低成本的近距离无线连接为基础,为固定与移动设备通信环境建立一个特别连接的短程无线电技术。在蓝牙系统中,音频的无线