论文部分内容阅读
第一部分:基因组选择是近十几年来动物遗传领域中发展起来的一种新育种方法,其主要的原理是假设控制性状的QTL与标记或者单倍型处于连锁不平衡状态,通过模型估算出性状的育种值。关于基因组选择的模型多种多样,其中主要的差异在于模型对SNP效应先验假设和算法的不同。GBLUP假设所有的SNP位点都有效应,且方差相等,这种假设对于只由少数QTL控制的性状来说是不准确的。相比之下,基于马尔科夫蒙特卡洛(Markov chain Monte Carlo,MCMC)抽样算法的Bayes方法的先验假设更加有“弹性”,也更符合实际,但其求解过程对于每个SNP都需要迭代几万次,以至于非常耗时。为此,本研究建立了一种Bayes框架下基于条件期望迭代(Iterative Conditional Expectation,ICE)快速求解的基因组选择模型(Four categories fast MixP,FCF-MixP),该模型假设SNP效应的先验分布服从四个期望为0,方差由一个大规模的F2群体共374类标准化表型确定的正态分布组成的混合分布。为了验证该模型的可靠性和计算速度。首先、本研究随机给定了两组先验分布的方差比例,并选取了两个表型进行准确度验证,结果使用原始方差比例的模型准确度更高,表明估算得到的方差比例有较高的可靠性和广谱性;接下来、本研究选取了GBLUP、BayesR、BayesA、BayesB四个软件与FCF-MixP进行准确度上的比较。为了探索不同遗传力及遗传结构对基因组选择准确性的影响,我们使用了6个遗传力和遗传结构不同的性状进行对比。结果显示BayesR、BayesA、BayesB三种基于MCMC算法的软件对由有大效应QTLs控制的性状的估计准确度比FCF-MixP和GBLUP略高,而FCF-MixP的效果要好于GBLUP;而对于由微效多基因控制的性状,五种方法的准确性相差无几,FCF-MixP比其他四个软件略好;为了探究FCF-MixP在其他群体中的效果,我们使用了一组杜洛克数据进行验证,结果显示FCF-MixP、GBLUP、BayesR、BayesA、BayesB的计算准确度分别为0.8176、0.9056、0.9905、0.8612、0.8892。最后、我们统计了五种软件的计算时间以及FCF-MixP的计算时间随参考群个体数目增加的变化规律,在参考群体较少时,基于ICE算法的FCF-MixP和GBLUP属于同一个等级,它们的计算速度都非常快,要比基于MCMC算法的三个软件快几百倍甚至上千倍,且FCF-MixP的计算时间随着参考群体个体的增加呈线性增长,随着基因组数据和参考群数据的不断增大,基于MCMC算法的基因组选择方法将会面临严重的计算负担,直接法中关于亲缘矩阵的求逆过程也会变得非常困难。因此,兼顾准确性和计算效率的FCF-MixP将能广泛应用于基因组选育中。本研究开发的FCF-MixP可以通过链接https://github.com/xuwenwu24/FCF-MixP.git免费获取。第二部分:猪阴囊疝是猪中最常见的先天性缺陷之一,给养猪业造成严重的经济损失且影响动物福利。鉴别影响猪阴囊疝的易感/抗性QTL并用于基因选育,对减少猪阴囊疝的发生具有重要的意义。本研究设计了一个由阴囊疝个体的健康全同胞交配产生的特殊疝气群体,验证了阴囊疝的遗传性并提高患病个体在群体中的比例,增强关联分析的功效。该群体包含246个个体,其中患病个体18个,约为随机交配群体患病率的3倍。随后,本研究利用该群体进行基于芯片数据和基因填充后数据的全基因组关联分析,8号染色体上的114.1-138.9Mb(24.8Mb)区域和猪阴囊疝显著关联。为了进一步缩小该区域,本研究使用遗传分化分析(Genetic differentiation analysis)以及连锁和连锁不平衡分析(Linkage disequilibrium and linkage analysis,LDLA)两种分析方法进行精细定位,遗传分化指数(Fst)显示健康猪和患病猪在8号染色体的116.1-132.7Mb区间内存在很强的遗传差异,LDLA分析的结果显示最有可能的置信区间在8号染色体的121-123.99Mb区域。综合LDLA分析和遗传遗传分化分析的结果把影响猪阴囊疝QTL的置信区间缩小到2.99Mb。最后,通过单倍型共享分析本研究发现了两种和猪阴囊疝相关的易感单倍型,在这两种单倍型的区域内存在一个潜在的易感基因(EIF4E),本研究为猪阴囊疝的抗病育种打下了科学的基础,为人类阴囊疝的研究提供了一定借鉴。