基于加权非负矩阵分解的肿瘤基因表达数据聚类研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lyx_suda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,肿瘤疾病历来都是威胁人体健康的“头号杀手”。一般来说,一种特定的肿瘤类型通常会包含多种亚型,而不同的亚型具有不同的基因表达模式,对于相同的临床治疗也会产生不同的效果。因此,准确识别肿瘤亚型类别对于肿瘤疾病的有效治疗至关重要。目前,基因表达数据已广泛应用于肿瘤亚型识别的研究中,并由此提出了众多机器学习算法。非负矩阵分解是机器学习算法的一类杰出代表,近年来得到了快速发展并衍生出了一系列实用算法。本文通过对非负矩阵分解模型的研究并结合基因表达数据的特点,分别提出了基于非负矩阵分解的聚类算法和双聚类算法,并将其应用于肿瘤亚型识别。本文是围绕肿瘤亚型识别的聚类问题展开的,主要开展了以下研究工作:(1)通过熟悉特征选择方法的理论基础及其对数据挖掘的重要意义,本文提出了一种针对于肿瘤亚型识别的特征选择方法。通过该方法筛选出具有代表意义的基因子集,剔除不相关的、冗余的基因,不仅可以提高算法的效率,同时也在一定程度上改进了算法的性能。(2)通过掌握非负矩阵分解的现有模型、算法和应用,本文提出了一种加权非负矩阵分解算法,具体而言,就是将基因权重值嵌入非负矩阵分解模型的目标函数和迭代规则中。这样后续的聚类算法就能够充分考虑所选基因的重要性权值,从而进一步提高肿瘤亚型识别额的准确率。(3)此外,本文还提出了一种基于非负矩阵分解的双聚类算法,双聚类算法能够同时在基因维度和样本维度上进行聚类分析。实验证明,相比于单聚类分析,双聚类算法在对肿瘤基因表达数据进行亚型识别方面更具有优势。
其他文献
[摘 要]高职院校音乐教育作为我国的主要教育科目之一,旨在培养具备音乐理论知识和表演能力的人才。目前许多高职院校开设有音乐课程教育,但由于高职院校对于音乐教育的不重视以及对其相关的投入较低等原因,导致许多高职院校在音乐教育方式上没有更多的改进与完善,使音乐教育仍采用传统的教育方式。学校应明确高职院校音乐教育的意义,透析目前高职院校音乐教育中的问题,从而更好地促进音乐教育的发展。  [关键词]加强教
近几十年,变点问题逐渐成为统计学者研究的一个热点方向,理论研究与实际应用都得到了快速发展,国内外产生了许多关于变点问题的理论与实际应用成果,诸如Csorgo、Horvath、Hac
本文利用Hamilton函数求得包含地形的半地转正压模式中存在有限振幅周期波解与孤立波解的条件,并给出了波解的解析式,得到一些有意义的结果。
股票市场的产生和发展极大的推动了市场化资源配置机制的形成和完善,中国股市是一个新兴的市场,投资者当中散户相较于国外比例更高,投资者在大多数情况下,都不知道重大政策出台的时间以及政策的力度,同时投资者对各种政策:如货币、财政政策、贸易政策等,各种消息:如IPO公告、资产重组、金融危机等非常敏感,容易追涨杀跌,导致股票收益率的异常波动,产生跳跃行为。同时,还关注到股票价格和成交量也在发生变化,而且呈现
随着经济全球化与教育国际化的不断深入,各国各高校越发重视教育的跨境交流与合作,我国也明确提出要加强国际交流与合作。高等教育领域尤其是研究生教育的对外交流发展迅速,对提高研究生培养质量起到了积极的作用。然而在形式和数量不断扩充同时,学生境外交流项目的实施成效也应引起我们的注意。本研究采取了定性和定量相结合的方式,分析了S大学学生境外交流项目的概况,对S大学研究生境外交流项目的类型和特点进行了描述。研
增速放缓的新常态下部分行业投资过度,带来过剩产能的同时削弱资源配置效率、阻碍经济发展。部分已被市场淘汰的企业依赖政府补贴和银行信贷的支援持续“吸血”,导致僵尸企业问题凸增。在关系复杂的供应链环境中,僵尸企业高负债、低盈利、高“吸血”及低周转的困境特征,通过供应链传递至其他上下游节点企业并产生溢出效应影响,导致其他节点企业长短期绩效的下滑。理论分析和实际经验表明,“牛鞭效应”和替代成本导致僵尸企业对
超导材料具有零电阻以及完全抗磁性的特性,在电力、交通、医疗等方面有广泛应用。超导体的发展从最早的低温超导体,到传统的铜氧化物高温超导体,随着研究的深入,对铜氧化物的