不同标记基因型编码值对关联分析的影响

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:xiaobeisc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全基因组关联分析(genome-wide association studies,GWAS)与连锁分析在动植物和人类数量性状遗传剖析和基因发掘中广泛应用。因此,研究GWAS方法学中的科学问题具有理论与实践意义。虽然已有很多基于混合模型的GWAS方法,但是这些方法及其软件包使用的基因型aa、Aa和AA的编码值有所不同,主要有(-1,0,1)、(0,0.5,1)、(0,1,2)、(-2p,1-2p,2-2p)、(0,1,0)和(-1,1,-1)六种。利用不同基因型编码值的QTN(quantitative trait nucleotide)检测结果是否有差异,目前未见报道。为弄清在具有异质基因型自然群体中上述不同编码值对关联分析的影响这一问题,本文首先模拟了自然群体基因型与数量性状表型数据集,将标记基因型数据集转换为六种不同基因型编码值数据集,通过mrMLM算法检测数量性状表型观测值与标记基因型编码值之间的关联,以研究不同标记基因型编码值对关联分析的影响。然后,将上述自然群体变为理想F2群体,用mrMLM、FASTmrMLM、FASTmr EMMA、p LARm EB、p KWm EB和ISIS EM-BLASSO方法进一步研究标记基因型编码值对QTL(quantitative trait locus)定位的影响。最后,利用品种资源群体和F2群体真实数据集,验证不同标记基因型编码值对关联分析的影响。其主要结果如下:1、在模拟的自然群体中,设置了第1~3个加性QTN、第4~6个显性QTN和第7~10个加性-显性QTN,将标记基因型数据集分别转换成前四种标记基因型编码值后,利用mrMLM算法分析数量性状表型观测值与标记基因型编码值的关联。结果表明:上述10个QTN的检测功效分别为39.8~41.5、98.9~99.3、99.2~99.4、0.0、0.0、0.0、98.8~99.3、95.6~96.3、27.5~29.7和3.6~4.0(%)。这表明这四种编码值不能检测第4~6个显性QTN,加性和加性-显性QTN的检测功效随加性效应贡献率的增加而增大。若将标记基因型数据集分别转换为后两种标记基因型编码值,利用mrMLM算法分析数量性状表型观测值与标记基因型编码值之间的关联。结果表明:上述10个QTN的检测功效分别为0.0、0.0、0.0、33.2~34.3、94.3~94.6、96.2、2.0~2.4、1.7~1.9、72.2~73.9和100.0(%)。这表明这两种编码值不能检测第1~3个加性QTN,显性和加性-显性QTN的检测功效随显性效应贡献率的增加而增大。QTN参数估计值的变异系数会随着QTN贡献率的增大而变小。虽然不同编码值QTN效应估计值间的关系符合数量遗传学规律,但是与真值有些偏差。这六种编码的假阳性率和假阴性率分别为6.029~6.950(?)和53.05~59.87(%),控制较好。2、在F2群体中,用mrMLM算法检测数量性状表型观测值与前四种标记基因型编码值之间的关联,上述10个QTL的检测功效分别为19.0、57.5~58.0、83.0~83.5、0.0、0.0、0.0、85.0~85.5、83.5~84.5、38.0~38.5和5.0(%)。用mrMLM算法检测数量性状表型观测值与后两种标记基因型编码值之间的关联,上述10个QTL的检测功效分别为0.0、0.0、0.0、17.5、66.5~67.0、88.0~89.0、1.5、5.5、76.5和84.5~85.0(%)。若用FASTmrMLM、FASTmr EMMA、p LARm EB、p KWm EB和ISIS EM-BLASSO方法,其规律与mrMLM的一致。QTL参数估计值的均方误差会随着QTL贡献率的增大而变小。QTL效应估计值的无偏性较好,优于自然群体。这六种编码的假阳性率和假阴性率分别为3.198~4.745(?)和62.70~66.00(%),控制相对较好。3、用mrMLM方法还检测了Zhou等(2012)的278个水稻永久F2个体千粒重与1619个bin标记间的关联以及Zhao等(2011)的374个亚洲稻开花时间与36901个SNP标记的关联。结果表明:在前四种标记基因型编码值下,检测到了千粒重纯加性基因GS3和GW5/qsw5以及开花时间在第7条染色体上23.2~23.3Mb区域上的近似纯加性位点id7004091,未检测到开花时间在第8染色体24.1~24.2Mb区域上的纯显性位点wd8004070,但是在后两种标记基因型编码值下,没有检测到千粒重纯加性基因GS3和GW5/qsw5以及开花时间近似纯加性位点id7004091,却检测到了开花时间在第8染色体区域上的纯显性位点wd8004070。上述结果与模拟研究结果一致,说明不同标记基因型编码值对关联分析是有影响的。综上所述,在前四种标记基因型编码值数据集中,不能检测只具有显性效应的位点;在后两种编码值数据集中,不能检测只具有加性效应的位点。
其他文献
中药桑白皮中分离出的一种对HIV-1的5’-LTR序列(HIV-1的逆转录启动子)具有很高的抑制作用的苯并吡喃环类黄酮化合物—摩鲁新-L(Morusignin-L,2′,4′,5-三羟基-3-(γ,γ,γ-羟基
绿潮(Green tides)是世界各国沿海普遍发生的一种藻类生态灾害现象,通常由潮间带生长的大型海洋绿藻大量增殖并聚集,在局地形成高生物量或者脱离附着基漂浮入海形成有害藻华。绿潮的暴发不仅受到温度、光照强度、营养盐等环境因素的影响,而且取决于自身的生理生态学功能。已有研究表明,暴发绿潮的物种多表现出较强的光合固碳能力与环境耐受力。基于此现象,本研究选择了绿藻门石莼属(Ulva)的三个绿潮物种,浒
崇明东滩湿地是长江口规模最大、发育最完善的河口型潮汐滩涂湿地,具有丰富的植物、无脊椎动物、鱼类、两栖类、爬行类以及鸟类资源。地理位置的特殊性和快速演化的生态系统特征使崇明东滩成为具有国际意义的重要生态敏感区。崇明东滩盐沼湿地围堤工程是一项以清除入侵物种为目的的生态修复工程,通过修筑围堤的方式,清除外来物种互花米草,为鸟类提供适宜的栖息地和充足的食物来源。在生态修复工程进行的同时,必然会对崇明东滩的
细胞力学是现代生物力学的前沿领域,研究力学因素对细胞的影响越发受到重视。其中,机械力刺激如拉力、压力、剪应力等在调节细胞行为中发挥重要作用,通过研究细胞的力学响应
研究气候变化对赣江尾闾段水环境的影响,可为赣江尾闾段水环境保护提供一定的科学依据,具有重要的意义。本文基于区域气候模式RegCM4.6预估赣江流域未来气象数据,运用SWAT模型模拟预测外洲水文站在RCP2.6、RCP4.5和RCP8.5三种排放情景下未来时段的径流数据,再利用MIKE二维水动力水质模型将外洲水文站三种排放情景下未来时段的径流数据作为输入数据模拟赣江流域尾闾河段在三种排放情景下的氨氮
由于现实生活中拍摄图像效果有时不如人意,因此需要将同一场景下不同聚焦目标的各自清晰区域进行融合,从而得到全局清晰图像,该过程称为多聚焦图像融合。传统图像融合算法中存在模型设计复杂、融合图像质量不佳等问题,而深度学习技术使用神经网络进行图像特征学习,训练快、功能性强,故本文采用卷积神经网络对多聚焦图像融合算法中存在的问题加以优化。论文研究工作主要从下面几个方面进行:(1)针对多聚焦图像融合算法,介绍
基于材料可饱和吸收效应实现脉冲激光的被动调制方式具有系统结构紧凑、调制过程快、成本低等优势,并且有潜力获得比声光或电光等主动调制方式更短的脉冲输出,因此被认为是超短脉冲激光器最为经济的实现方案。但目前商用的半导体可饱和吸收镜存在工作带宽窄、响应速率慢等问题,而目前各类基于新型二维材料的可饱和吸收体则存在稳定性差、难以量产等难题。本论文提出采用局域表面等离激元共振(LSPR)来增强非线性响应,并基于
本文的目的主要是研究在实Hilbert空间中一类带不动点问题约束的最优化问题的混合迭代算法,我们提出了一种迭代算法用来寻找分裂可行问题和涉及到Lipschitz伪压缩映像的不动点问题的一个解.在适当的条件下,证明了由我们提出的迭代算法生成的序列弱收敛到分裂可行问题与不动点问题的一个解.本文对已有结果做出了改进和发展.本文主要分为四部分.在第一章中主要介绍了分裂可行问题的研究意义和国内外研究现状,并
静电纺丝技术因其具有工艺简单、价格低廉、原材料广泛等特点,被认为是制备纳米纤维膜的理想技术。利用静电纺丝技术制备纳米纤维膜在生物医学领域具有非常广泛的应用前景,尤
在治疗骨折过程中,首先需要对骨骼进行预钻孔,以便植入固定物。预钻孔的好坏会影响固定物的稳定性。想要获得比较理想的钻削过程,关键在于减少刀具与皮质骨之间的摩擦和降低刀具在切削过程中产生的阻力。近年来表面织构的相关研究表明:合理的表面微织构可以起到良好的减摩作用同时也可以改善刀具的减摩性能,这为通过改变刀具刀面的表面微观几何形貌来提高刀具的切削性能提供了新的思路和新的研究方向。本文利用激光打标技术在刀