论文部分内容阅读
水稻是世界上三大主要粮食作物之一,也是大部分亚洲人的主食。水稻作为一种单子叶的模式植物,其基因组学和基因功能研究也促进了人们对植物基因功能的了解。在2005年随着高精度的水稻全基因组序列测序的完成,水稻分子生物学研究进入了快速发展时代。 构建基因型变异图谱是进行基因组学分析的基本步骤。在植物研究领域已有一些针对拟南芥和栽培稻等一些高度纯合的基因组的基因型鉴定的方法,却很少有针对植物中存在杂合基因型的复杂基因组的基因型鉴定方法。由于植物基因组和人类基因组的差别很大,也不能把人类基因型鉴定的方法直接应用到复杂的植物基因组中。本研究开发了一套从含有大量杂合位点的复杂植物基因组中鉴定基因型方法,并成功应用在杂交稻和野生稻两个不同的复杂基因组材料的基因型分析。对比其它的基因型鉴定软件,本方法能够显著性的提高基因型鉴定的准确度和数据处理的效率。同时,本方法也能够从植物转录组数据中鉴定多态性位点。因此,利用本研究的方法同样也可以构建转录组的变异图谱。 普通野生稻是亚洲栽培稻的祖先,栽培稻分为籼稻和粳稻两个亚种,粳稻再分化出热带粳稻和温带粳稻两个生态类型。利用本研究开发的复杂基因型鉴定方法(HetMap),从野生稻群体的重测序数据中鉴定多态性位点。率先在野生稻中构建了具有杂合基因型的变异图谱。研究发现杂合基因型主要是在抗病相关的基因里面富集,而且它们在基因组上是成簇分布的。栽培稻长期受到人类的选择驯化在人造环境中生长,野生稻群体相比于栽培稻具有更多的抗逆、粒型和株型相关的遗传变异位点。由于本研究构建了精确的野生稻基因型变异图谱,我们利用全基因组关联分析方法定位了一些表型相关的位点,并对它们的地理分布进行了分析。利用以前发表的栽培稻的基因型数据和野生稻的基因型数据,本研究分析了栽培稻中不同群体之间的基因渗透,鉴定到了一些从籼稻往热带粳稻渗透的位点。通过渗透位点关联的分析,我们发现基因渗透在栽培稻群体广泛存在,它们在栽培稻的驯化过程中起着重要作用。 本研究通过和其它课题组合作,也开展了四倍体栽培棉花重测序数据分析。棉花是一种重要的纤维和食用油作物。棉花是由原始的A基因组的二倍体和原始的D基因组融合,然后经过驯化形成的异源四倍体。通过对147份栽培棉花的重测序分析,本研究率先构建了四倍体棉花的基因型变异图谱。利用基因型多态性数据,我们构建了棉花的最近邻系统发生树来研究它们之间的进化关系。本研究发现栽培棉花两大类群体基因组分化程度很大。利用陆地棉的半野生种和陆地棉栽培种的多态性的比较,本研究在陆地棉中鉴定到了109个驯化位点。通过利用棉花不同组织的转录组数据进行注释,我们发现这些驯化位点很多基因和棉纤维发育以及种子萌发有关。虽然陆地棉和海岛棉基因组分化严重,然而我们在一些局部位点发现了基因渗透位点。一些渗透位点在以前研究也被报道过,证明了本研究基因渗透鉴定方法的准确性。通过和已知QTL位点的重叠分析发现这些渗透位点和控制棉纤维的长度和产量相关。 本研究解决了复杂基因组基因型鉴定的难题,利用新开发的方法我们加深了对野生稻基因组变异的认识。对于栽培稻我们也发现了基因渗透在水稻表型决定中的作用。通过对棉花重测序数据分析本研究解析了一个复杂的四倍体基因组群体数据,率先在此物种中构建了基因型图谱,为棉花的相关研究提供了很好的资源。