【摘 要】
:
DNA微阵列产生巨量的表达谱数据,用以挖掘特定的生物信息,而对表达谱数据的分析离不开有效而可靠的可视化算法。ISOMAP是一种新的非线性降维方法,应用它可以发现隐藏在高维数
论文部分内容阅读
DNA微阵列产生巨量的表达谱数据,用以挖掘特定的生物信息,而对表达谱数据的分析离不开有效而可靠的可视化算法。ISOMAP是一种新的非线性降维方法,应用它可以发现隐藏在高维数据内在的结构特性,可以将数据可视化。然而,噪声的干扰和邻域大小的不合适会在ISOMAP算法的邻域图中引入“短路”边,使其不能正确表达数据的邻域结构。基于最小连通邻域图能有效避免“短路”边,而连接距离对“短路”非常敏感,本文指出“短路”会导致连接距离差分布中的重拖尾现象,并提出一种能有效删除“短路”边,从而消除重拖尾现象的LD-ISOMAP算法,这极大地削弱了ISOMAP算法对邻域大小的依赖程度,并从定程度上降低了噪声的影响,从而使其更具鲁棒性和拓扑稳定性。新算法特别适合于快速了解数据的结构特性,为后续的定量、深入分析提供理论依据。模拟数据和真实基因芯片数据的实验结果很好地验证了该算法的有效性。
其他文献
低密度校验(LDPC)码是一类逼近香农限的编码,已成为当今信道编码领域的研究热点之一。利用组合设计构造的一些LDPC码具有循环或准循环结构,不仅性能接近随机构造的最优LDPC码
随着信息技术的发展和后PC时代的到来,嵌入式产品成为当今IT产业的重要需求之一,同时巨大的嵌入式应用也对嵌入式设备提出了更高的要求,用户也出原要求“能用”转变为用得舒适,便
传统的色彩校正技术基于ICC规范,使用基于三刺激值的色度色彩空间,这使得色彩匹配往往是同色异谱匹配,仅能在同一观察条件下实现色彩的一致再现,若观察环境改变则颜色不再匹
小波分析已经广泛应用于信号处理与分析中,并取得了较为突出的效果。但在高维情况下,小波分析并不能充分利用数据对象的几何特征。针对小波理论的这一局限,人们在小波理论的
进化计算是一种模拟生物进化过程与机制求解问题的自适应人工智能技术,是一类随机搜索技术。它们模拟由个体组成的群体的学习过程,其中每个个体表示给定问题搜索空间的一点。
SNP(Single-Nucleotide Polymorphism,单核苷酸多态)是一种新的遗传标记。它在人类遗传变异中非常普遍,几乎占到已知变异多态性的90%以上。对SNP研究是后基因时代生物信息学研究
在事务数据库中挖掘关联规则一直是数据挖掘的热点问题。Agrawal提出了经典的基于频繁项集的Apriori算法,算法产生规则是以交易数据的数据库内容为基础进行匹配。随着数据库
特征选择技术是当前信息领域,尤其是模式识别领域的研究热点之一。基因选择是特征选择中的一个应用。基因选择在疾病预测方面有非常重要的实际意义。现存的一些基因选择方法
虚拟实验平台是网络虚拟实验室系统的主体部分,.而虚拟仪器模型以及虚拟仪器之间的交互控制关系模型研究实现又是虚拟实验平台实现的关键所在。本文从基于电类虚拟实验平台实
由于网络环境的开放性、服务自身负载的波动性、用户需求的不确定性等复杂易变的环境因素,导致Web服务的服务质量(Quality of service,QoS)呈现出高度的动态性,并且QoS是制约