【摘 要】
:
在全基因组关联分析中,为避免假阳性错误常用线性混合模型(LMM)分析数量性状。求解线性混合模型需要先构建亲缘关系矩阵,再估计剩余方差组分,最后使用加权最小二乘求解当前标记的效应值并检验。由于方差组分估计过程涉及复杂的非线性求解,所以对高通量SNP逐个重新估计剩余方差组分使得完整的线性混合模型求解会消耗大量时间、占用巨大的计算机内存。研究者们提出许多简化算法来降低LMM的计算成本,这些方法主要分为两
论文部分内容阅读
在全基因组关联分析中,为避免假阳性错误常用线性混合模型(LMM)分析数量性状。求解线性混合模型需要先构建亲缘关系矩阵,再估计剩余方差组分,最后使用加权最小二乘求解当前标记的效应值并检验。由于方差组分估计过程涉及复杂的非线性求解,所以对高通量SNP逐个重新估计剩余方差组分使得完整的线性混合模型求解会消耗大量时间、占用巨大的计算机内存。研究者们提出许多简化算法来降低LMM的计算成本,这些方法主要分为两类:一是将多基因效应固定为基因组育种值的GRAMMAR法,再是将多基因遗传力替换随机效应项的EMMAX法。数量性状中的二岐性状虽然只有两种表现型,但是和连续正态分布的性状相似,很多二岐性状也受到多基因效应的影响,如果直接采用广义线性回归同样会导致假阳性,所以需要采用广义线性混合模型(GLMM)对二岐性状进行全基因组关联分析。与一般线性混合模型相比,完整的GLMM求解过程虽然和LMM类似,但更难求解。为了简化GLMM的求解过程,线性混合模型简化求解的思想被移植到广义线性混合模型上,也相应产生了一系列简化算法,如借鉴GRAMMAR法的milor GWAS和SAIGE,以及借鉴EMMAX法的GMMAT、和LTMLM。然而广义线性混合模型的复杂性导致现阶段这些移植的简化算法表现并不稳定,广义线性混合模型的简化算法还需要不断进行开发。虽然GRAMMAR法在扫描时有着极低的计算复杂性,但全基因组关联分析结果存在严重的假阴性错误,这影响数量性状位点(QTN)的检测,所以本研究沿用EMMAX法的主张,基于广义线性混合模型,提出了二岐性状广义线性混合模型简化算法,并将此方法命名为Binary Emmax法。Binary Emmax法首先对亲缘关系矩阵进行谱分解,采用边际最大似然法估计方差组分后并将其固定,再通过迭代重加权最小二乘求解广义线性混合模型,和同样基于EMMAX法的GMMAT相比,Binary Emmax法在方差组分估计方面比较稳定且有较高的准确度,同时也有着更好的统计性质和QTN检测效力。我们采用两个亲缘关系复杂程度不同的人类和玉米基因组数据集进行了模拟实验,模拟了不同的遗传力和不同的QTN数量的二岐性状组合。从遗传力估计、统计性质、QTN检测效力三个方面来评判Binary Emmax法的性能。计算机模拟实验表明:(1)、遗传力估计:Binary Emmax法估计的遗传力与真实值很接近,而且未出现过估计的遗传力不在0-1范围内的情况,而GMMAT在很多组合下估计的遗传力与真实值相差较大,且出现估计的遗传力不在0-1范围的次数较多。Binary Emmax法遗传力估计的准确度较高,稳健性较好。(2)、统计性质和QTN检测效力:Binary Emmax法的统计性质和QTN检测效力可媲美,甚至略优于GMMAT法。为了对新方法的性能进行验证,对半滑舌鳎(Cynoglossus semilaevis)性逆转性状以及CFW小鼠骨质疏松性状进行了全基因组关联分析,对于半滑舌鳎数据集,Binary Emmax法在21号染色体检出1个QTN,22号染色体上各检出5个QTN,而GMMAT法仅在22号染色体上检测出2个QTN;对于CFW小鼠数据集,Binary Emmax法与GMMAT表现出相同的检测效力,都在11号染色体上检测出一个QTN。因此可以证实:Binary Emmax法能比GMMAT法检测出更多的QTN。此外,我们还提出一种简单回归尺度转换高效定位二岐性状的方法,首先对亲缘关系矩阵进行谱分解,特征向量作为主成分,矫正二岐性状中的群体分层,再求解每一个主成分的回归系数,并将众多协变量与其各自的回归系数相乘,得到的乘积合并为一个新的协变量;然后将它作为线性回归的协变量逐个进行关联检验;最后对筛选获得的候选数量性状核苷酸(quantitative trait nucleotides,QTN)进行广义线性模型回归分析,将效应和方差转化为广义线性模型尺度。将此方法用于半滑舌鳎性逆转性状全基因组关联分析,定位相关QTN。
其他文献
在全球变化和人类活动的多重压力下,局部海域环境恶化,近海生物资源衰退现象日益严重。为此,我国加快了人工鱼礁建设和增殖放流活动,以期通过海洋牧场建设达到修复受损生境和养护生物资源的目的。自2015年开始,加上2020年第六批国家级海洋牧场示范区,目前已经获批建设的国家级海洋牧场示范区达136个。日益扩大的海洋牧场虽然取得了显著的经济效益和社会效益,但是海洋牧场的生态环境效应评价和增殖放流物种承载力评
中国对虾(Fenneropenaeus chinensis)是我国重要的海水养殖经济物种之一,上世纪80年代至90年代中国对虾养殖产量取得重大突破,逐渐成为我国重要的海水养殖品种之一。目前由于白斑综合症病毒(white spot syndrome virus,WSSV)的影响以及国内对虾种质资源良莠不齐等问题的困扰,中国对虾养殖产业依然面临巨大挑战。为了保证我国对虾产业的可持续发展,自1996年黄
凡纳滨对虾(Litopenaeus vannamei)具有生长速度快和抗逆性强等优势,是世界三大优良养殖虾种之一。我国凡纳滨对虾养殖国内自主新品种市场份额少,多数种源依赖国外。对育种基础群体进行遗传评估时,由于多数奠基者群体的遗传背景不清楚,忽略其遗传性能差异,加性遗传方差可能被高估。因此,需要找到准确评估基础群体的模型。在传统的遗传评估方法中,通常基于系谱信息估计育种值,同胞选择、家系间选择等准
海带(Saccharina japonica)是我国大规模栽培的经济海藻,具有很高的应用和生态价值。由于近海海水污染、养殖管理不善、苗种种质退化等原因,海带苗期病害频繁发生,造成了较大经济损失。本文以对海带育苗期病害进行了调查,对幼苗绿烂病的病原进行了分离、鉴定和回接感染实验,进一步建立了2种病原的检测方法,检测了病原侵染过程中海带苗生理生化指标,以期为海带苗期的病原学研究提供理论和技术支持。本研
对虾急性肝胰腺坏死病(Acute hepatopancreatic necrosis disease,AHPND)发病快、流行面广、死亡率高,是近年来影响对虾健康养殖的重要限制性因素,给中国乃至全球对虾养殖业带来了巨大的经济损失。系统研究对虾AHPND发生与哪些因素显著相关,并进一步建立对虾AHPND发生的预测预报数学模型,对防控对虾疾病的发生以及建立针对性防治措施具有重要意义。本文以池塘养殖凡纳
硬骨鱼类由于其进化中的原始性以及生活条件的复杂性,因而有着非常复杂的性别决定和分化机制。在大多数的硬骨鱼类中,同时存在着遗传性别决定(GSD)和环境性别决定(ESD)。表观调控在ESD中具有重要的作用,能够通过调节基因的表达来适应环境的改变,被认为是环境与基因型之间的相互作用的桥梁,之前研究表明长链非编码RNA一类重要的表观调控因子,可通过染色质的重塑、组蛋白修饰等方式在表观调控中具有非常重要的作
海带配子体克隆系具有发育全能性、遗传纯合等特点,是海带种质资源保存的对象,可为海带种质改良和苗种繁育提供丰富的遗传材料。本文评价了关键环境因子对海带配子体克隆生长、发育与生殖的影响,进一步优化了调控海带配子体生长、发育与生殖的环境条件,并从外观形态、亚细胞结构、生理生化及转录组等方面,比较分析了配子体在生长、发育、生殖阶段的特征及差异。主要研究结果如下:(1)铁离子对海带配子体克隆系营养生长和生殖
在中国,抗生素被广泛用于人类和动物疾病的治疗,农业和畜牧业还大量使用抗生素作为生长促进剂,这使得抗生素在河流的水体和沉积物、土壤和污水处理厂等各种环境介质中残留。抗生素在环境的大量残留使其以养殖水源水的形式进入养殖环境并导致了其在水产品中的积累,影响了水产生物机体内的微生态平衡,直接诱导了抗性菌(antibiotic resistant bacteria,ARB)和抗生素抗性基因(antibiot
仿刺参(Apostichopus japonicus)又称刺参,具有重要营养价值和药用价值,是我国第五次海水养殖浪潮的代表性物种之一,其养殖业为我国沿海渔业经济发展提供了重要途径。然而,近年来,病害和高温灾害给海参养殖产业造成了巨大的经济损失,疾病和高温成了海参产业可持续发展的瓶颈。解析刺参响应病原菌和高温的分子机理,将为开展刺参良种选育和健康养殖工艺优化奠定科学基础。本研究以刺参为研究对象,采用
大菱鲆(Scophthalmus maximus)原产于欧洲的一种经济鱼类。其最适生长温度为14-17℃,由于近些年养殖规模的扩大,适合养殖用水逐年减少,使得大菱鲆在养殖过程中容易受到高温的影响,造成鱼体生长速率和抗病力下降。为减少大菱鲆模化养殖过程中高温的影响,需加强大菱鲆抗逆选育及其抗逆机制研究。本研究以高温胁迫条件下,皮肤转录组测序数据中筛得的热休克蛋白47(HSP47)基因为研究对象,运用