复杂疾病特征基因挖掘的方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:miclleg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从SNP标记数据和基因表达谱数据的分析着手,以挖掘复杂疾病基因和研究基因功能为主要目标,发展创新的模式识别方法、数据挖掘技术和生物信息学领域知识匹配技术,提供SNP标记数据和基因表达谱数据分析的系统化、最优化策略.首先,我们明确地给出了对疾病有鉴别意义的"疾病鉴别基因"和与致病分子基础有关的"疾病相关基因"的概念和定义;第二,在复杂疾病基因定位方法的研究工作中,我们将遗传标记作为导致疾病分型的特征,视基因作图为提取疾病特征标记的模式识别问题,提出了同胞对基因连锁分析的模式识别方法.该方法能够较全面地反映多基因互作、基因和环境因素共同作用等情况,这是一种全局的分析策略,具有开创意义;第三,我们提出了基于分类树的集成特征基因挖掘的集成决策方法EFST和EFST的推广方法——基于决策森林特征基因挖掘方法.同时,对特征基因挖掘中特征识别技术做了进一步研究,利用遗传算法(GA)和支持向量机(SVM)二者优势,提出GA和SVM耦合的特征基因挖掘方法GA-SVM,由支持向量机等模式分类器评价识别的特征基因,应用Gene Ontology功能分子生物学数据库,解释了复杂疾病特征基因的分子生物学机理;第四,针对疾病的多类表现和疾病类别的层次性,我们提出了多类动态特征基因挖掘与融合的新方法,有效地解决了特征基因的局部性、稳定性、有效性、分类学的冗余性和生物学的相关性,以及特征的生物学可解释性等方面的问题;第五,我们提出了基于耦合双向聚类技术的疾病遗传异质性分析策略.利用部分有意义的基因信号发现疾病的亚型.这种分析策略克服传统的双向聚类方法或单向聚类的局限性,弥补了目前肿瘤的分型主要依赖于组织学及形态学特征的不足.我们成功地应用方法于弥漫性聚B细胞淋巴瘤异质性的分析;最后,我们提出了复杂疾病相关网络的反向构建方法,进而研究疾病相关基因间的调控关系,构建基因调控网络,在更深的层次上阐明复杂疾病的发病机理.
其他文献
唇读是用计算机再现聋人通过唇动破解语言规律读懂语言的过程,这是一项非常具有挑战性的科学发现,同时也可以用作语音识别的一种辅助手段,以提高自动语音识别抗噪声能力.唇读
在数据网格中,为了在在范围内共享巨大数量的数据资源,提高系统的运行效率,提高数据访问的可靠性,优化数据访问的性能,必然要涉及大量数据文件的复制、传输.既然存在复制,那
Web服务作为新一代分布式技术,它的松散耦合性、跨平台、跨语言、良好的互操作特性已为许多专家拥护并得到广大 IT公司和组织的支持。Web服务技术的应用是全球网络化高速发展
该文在系统分析了现有的视频检索技术的基础上,提出了在场景层次上综合多模态信息来分析视频内容的方法.对多模态、场景的概念、多模态综合的理论和意义以及如何综合多模态来
该文通过机器人部队(群机器人)追捕一个和多个猎物的过程来研究多个有限理性智能体在动态复杂环境下的最优合作机制与决策算法.具体研究以下几个主要方面:首先,提出多智能体
随着应用的深入和计算技术的发展,并行计算在数值计算领域里扮演着越来越为重要的角色,成为了解决很多大规模科学计算问题的唯一途径。 并行计算的应用离不开并行软件的支持
本文在分析和研究当前计算机辅助教学(CAI)状况的基础上,采用积件化的设计思想,研究和开发了基于Authorware的多媒体课件自动生成系统。该系统将课件的内容和结构分离开,为教师
该文主要研究由重力加速度变化(如在飞机上)而引起的应力变异,在对应力变异语音有效分析的基础上,分别从基于特征和基于模型角度提出可以抑制应力变异影响的有效方法.从基于
数字指纹图像识别是人类生物特征识别技术中最早应用、技术最为成熟、价格最低廉的分支,被广泛地应用在刑侦破案、住宅安全,银行、证券、保险等金融机构的身份确认,重要区域的门
随着科学技术的飞速发展,信息高速公路的普及,人们已经被包围在信息的汪洋大海之中。Internet是海量信息源,而且其信息的组织是异构的、多元的和分布的。由于信息不断地更新和增