全基因组单核苷酸多态性交互作用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:q157194179
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“人类基因组计划”和“国际千人基因组计划”的顺利完成,人们对复杂疾病的探索逐步转向全基因组关联研究(Genome-Wide Association Studies,GWAS)。GWAS通常以单核苷酸多态性(Single Nucleotide Polymorphism, SNP)为标记进行病例对照分析,以期从中发现与复杂疾病相关的遗传因素。SNP是人类可遗传变异中最常见的一种,往往通过非线性交互作用共同影响复杂疾病的产生和发展。认知与复杂疾病相关的SNP交互作用,在解释复杂疾病的致病机理,开展疾病预防、早期诊断、个性化治疗和生物药物研制等方面都具有重要意义。然而,由于SNP数据具有超高维、小样本、强噪声等特点,全基因组SNP交互作用研究至今还没有取得突破性进展,也因此成为了当前生物信息学领域的热点问题之一。本文对此展开了较为深入的研究,主要包括以下几个方面:1.针对全基因组SNP交互作用研究缺乏基准数据和致病模型的现状,开发了SNP数据仿真软件:EpiSIM(Epistasis SIMulator)。EpiSIM综合利用孟德尔遗传定律、哈迪-韦因贝格平衡准则及概率论等知识,通过定义平均相邻连锁不平衡(Linkage Disequilibrium, LD)水平,实现了LD模式、单体型块和较小等位基因频率等生物特性的仿真。EpiSIM扩展了现有的致病模型:既能仿真存在边际效应的SNP交互作用致病模型也能仿真不存在边际效应的SNP交互作用致病模型,同时还可将多个致病模型嵌入到一个仿真数据中。EpiSIM通过友好界面直接指定属性参数,不依赖种子数据,利用马尔科夫链实现SNP数据的仿真,且支持多种输出数据结构和批处理操作。实验表明EpiSIM是一个较好的SNP数据仿真软件,能够为后续研究工作提供数据保障。2. SNP交互作用识别方法有很多,但其相对性能还有待进一步了解。为此,开展了SNP交互作用识别方法的比较研究。首先,根据搜索策略归纳了SNP交互作用识别方法,并从中选取了五种代表性方法,即:TEAM,BOOST,SNPRuler,AntEpiSeeker和epiMODE。其次,模拟了不同数据规模、致病模型和数据噪声等情况下的仿真数据,其中数据噪声又细分为数据缺失、分型错误和拟表型等类型。然后,从识别能力、鲁棒性、敏感度和计算复杂度等角度分别比较了这些方法。结果表明,每种方法都有其优缺点,但没有一种方法在任何情况下都是完美的。从整体性能来看,AntEpiSeeker和BOOST无论从效率上还是从效果上都是值得推荐的方法。该研究结论为设计新SNP交互作用识别方法提供了初步思路。3.传统的SNP排序方法往往忽略了SNP可以通过交互作用影响表型的情况。针对这一问题,提出了一种SNP排序方法。该方法的关键是设计了一种基于共信息的相关性测度:CII(Co-Information Index)。CII值综合考虑了SNP在包含它的不同维度SNP组合上影响表型的能力:即有该SNP对表型的主效应,也尽可能的考虑了该SNP在包含它的不同维度SNP组合上对表型的边际效应。通过分析SNP组合维度的计算上限及时间复杂度,建议在小规模数据上利用穷举法精确计算CII值,在高维小样本数据上采用蒙特卡罗采样法估计CII值。仿真实验表明:与传统SNP排序方法相比,CII可以取得与之相当甚至更好的排序结果。在真实年龄相关性黄斑变性(Age-related Macular Degeneration,AMD)数据上的排序结果不仅验证了CII测度的实际应用能力,也发现了与AMD相关的新SNP。该工作为后续多阶段SNP交互作用识别方法提供了筛选阶段的理论基础。4.提出了一种基于共信息的多阶段SNP交互作用识别方法: EpiMiner(Epistasis Miner)。EpiMiner共有三个阶段,分别为筛选阶段,识别阶段和可视化阶段。在筛选阶段,EpiMiner利用CII测度排序SNP,并通过支持向量机分类器自动选择有较高CII值的SNP进入下一阶段。在识别阶段,EpiMiner分别利用共信息测度和基于共信息的置换检验测度依次搜索候选SNP集合中的SNP交互作用,并依据P值排序识别结果。为了解释和识别更高维的SNP交互作用,在可视化阶段,EpiMiner建立了边随边权重阈值改变的动态SNP交互作用网络。在仿真数据和真实AMD数据上的实验结果表明:EpiMiner在识别和可视化SNP交互作用上是一种有效可行的方法,可以同步识别多个不同维度的SNP交互作用,为后续SNP交互作用识别方法的研究提供了参考经验。5.多阶段SNP交互作用识别方法的性能受筛选阶段候选SNP集合的影响较大。为此,提出了一种基于启发式蚁群算法的SNP交互作用识别方法:AntMiner(Ant Miner)。在筛选阶段,AntMiner通过整合启发信息到搜索策略中提高了蚁群算法在迭代过程的计算效率和识别精度;迭代结束后,候选SNP集合和蚁群选出的候选SNP交互作用集合均进入下一阶段。在识别阶段,利用卡方检验测度穷举搜索和排序这两个候选集合中的SNP交互作用,得到最终识别结果。在仿真数据和真实AMD数据上的实验结果表明:AntMiner在SNP交互作用识别上是有前途的,为改进多阶段SNP交互作用识别方法提供了探索依据。
其他文献
当人类从农业经济时代向工业经济时代继而向知识经济时代迈进的过程中,主要反映社会生产力水平的劳动工具便由“锄头”向“机器”过渡继而由“网络”取代。与社会存在互为促
金融监管制度作为规范金融市场的基础性制度,在国际金融危机后呈现出组织架构逐步向统一监管过渡、审慎监管和行为监管相分离、加强消费者保护、强化中央银行职权等特征,我国
幸福与幸福感是不同的。幸福是多方面多层次的体系,不同层次的幸福之间可能相互矛盾。个人幸福与社会发展是对立统一的,克服人本主义教育观的错误倾向,正确处理学生需要与社
<正>从上面的城市大脑总体架构图可以看到,城市大脑分为三层,最下层为阿里云飞天计算平台,中间为阿里云城市大脑数据资源平台,最上层为阿里云城市大脑IT服务平台。其中数据资
机电一体化也叫做机械电子工程,是电机技术与机械工程的结合体,两种技术融合发展可以显著提升机电设备的性能,并具有降低劳动强度、节省劳动成本以及提高生产效率的显著优势,
目的:探讨超声在诊断肝脏实质性占位病变中的临床价值。方法:收集2014年2月-2016年1月我院拟诊断为肝脏实质性占位病变的患者,采取飞利浦公司生产的彩色多普勒超声诊断仪进行诊
根据半导体激光器的工作原理及速率方程,基于图形化编程语言LabVIEW开发出一套半导体激光器虚拟实验系统.该系统界面简洁,操作简单,交互性强,能够演示和模拟半导体激光器在自
如果让大数据“算法”来“接管”指挥城市交通,交通堵塞的情况是否能改善?10月9日上午,在杭州萧山区进行的一场“120救护车”演练,对这个问题给出了肯定答案。$$从萧山区的市心路
报纸
《劳动合同法》规定了用人单位解除劳动合同的严格条件,这对于制约和监督用人单位的解除行为,保护劳动者的工作权具有积极的意义。但是,由于立法规定的弹性化,给予用人单位很
初中学生无论在生理上还是心理特征上都存在非常大的差异性,对物理学科的兴趣和爱好、对知识的理解和接受能力都不尽相同,课堂中如果采用统一的授课模式,基础较好的同学觉得