加权SNP集分析方法在全基因组关联研究中的应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:wo6857953
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全基因组关联研究旨在通过寻找与复杂疾病相关的各种遗传因素,帮助人类全面揭示与人类疾病的发生、发展和治疗相关的遗传基因。目前为止,虽然GWAS中标准的病例.对照分析已经发现了许多与人类乳腺癌、前列腺癌、精神分裂症、糖尿病等复杂疾病有关的遗传基因,但是存在无法检测上位性效应和难以达到全基因组显著性等诸多缺点。因此全基因组关联研究中的SNP集分析方法受到越来越多的关注。本文根据目前SNP集分析方法中存在的缺陷从两个大的方面提出两个高效的SNP集分析方法—加权标签SNP集分析方法和相对次要等位基因频率加权分析方法。  首先为解决SNP集分析方法受SNP集质量困扰的问题,基于SNP集预处理的思想提出了一种有效的加权标签SNP集分析方法,并为该方法设计了一个基于SNP连锁不平衡结构的标签SNP快速选择算法和一个为评价标签SNP集中每个标签SNP地位的加权函数。本文基于PHGDH、HTR2A两个基因和HapMap计划的CEU样本,用HAPGEN2软件产生了大量的仿真数据,通过仿真实验验证,我们加权标签SNP集分析方法与基于原始SNP集的分析方法相比,在功效方面有较大改善,且能够降低较多的基因分型成本。标签SNP集的选择对检验的功效有较大的影响,本文比较了基于四种标签SNP集的检验方法的功效大小,结果表明基于本文提出的标签SNP集的检验功效是这四种情况下最优的。同时我们还通过实验验证了本文设计的标签SNP选择算法与其它标签SNP选择算法相比有较低的时间复杂度。  然后为摆脱针对常见变异和罕见变异没有统一的具有较大功效的关联检验方法的问题,在综合考虑了从病例组、对照组和所有个体三个角度估计次要等位基因频率的基础上提出一种相对次要等位基因频率加权分析方法。通过HAPGEN2产生大量仿真数据进行的实验验证表明,不论在何种假设(SNP集中常见变异导致疾病发生、罕见变异导致疾病发生或两种变异共同导致疾病发生)下,相对次要等位基因频率加权分析方法都具有较大的功效,且都明显优于现有的分别对常见变异和罕见变异分析方法的功效。
其他文献
2007年下半年以来,一场始于美国的金融海啸逐渐蔓延到世界各地,其速度之快、危害之大、范围之广为史上罕见。与我国、我省其他地区一样,作为欠发达地区的茂名市供销社系统,也
本文共有主要研究的内容有:根据所构造的广义的李代数,得到了NLS-mKdV方程族和分数维NLS-mKdV方程族的哈密顿结构,然后在此基础上得到了mKdV方程的解,最后运用mKdV方程描述了Ros
NAC转录因子家族是植物特有的一类转录因子,在植物的生长发育、器官建成及逆境胁迫和激素信号应答中均发挥重要作用。本研究在基因组范围内,利用生物信息学方法对番茄的NAC转
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期权是赋予其持有者在支付一定的期权费后所获得的在将来预先确定时间以预先确定的价格购买或出售某项标的资产的权利。几十年来,期权作为一种防范风险和套期保值的有效手段
采用完全双列杂交Griffing方法Ⅰ,分析了不同双亲耐旱性组合类型对后代耐旱性的影响及其亲本间耐旱性的一般配合力、特殊配合力和反交效应,同时对耐旱性主要遗传参数进行了分
今年以来,我国经济发展面临着比较复杂的国内外形势。国内面临着经济增长由偏快转为过热、价格由结构性上涨演变为明显的通货膨胀压力,遭遇了历史罕见的“低温雨雪冰冻灾害”
期刊
教育发展至今,历经多次改革,而无论教育进行怎样的改革,它的最终目标只有一个:让人能够拥有更完美的人生,体育与健康课的教学作为育人的一个部分也同样承载着这样的使命。著
有限时间随机稳定是指在有限的时间内系统的运行轨迹满足特定的要求,涉及到稳定性分析与系统反馈镇定控制器的设计等方面。过去十几年,人们主要研究的是满足上界需求的有限时间