论文部分内容阅读
基因重复是一种非常普遍和重要的生物学过程。基因重复产生的重复基因在突变和选择的作用下,可以产生具有新功能的基因,从而促使物种的分化和生物多样性的增加。生物体通过频繁的基因重复事件,能够产生一组序列相似的基因,构成基因家族。不同的基因家族有不同的进化方式,而这种进化方式上的差异与基因的功能有关。本文以植物中的Cyclin基因家族和AGL6类MADS-box基因为例,对它们进行详细的系统发育分析和进化研究。主要研究结果如下:
1、植物中Cyclin基因家族的系统发育和进化研究。
(1)Cyclin基因存在于植物的各个谱系中。通过全基因组序列搜索的方法,我们一共从8个全基因组测序的物种中得到了309个Cyclin基因。系统发育分析结果表明,它们分别属于A、B、C、D、H、P、L、T、SDS和J18类Cyclin基因。
(2)Cyclin基因编码的蛋白质具有保守的结构域。通过序列比对,我们发现A、B、SDS、D、L、T、C和J18类蛋白都具有保守的Cyclin_N和Cyclin_C结构域,而P和H类蛋白只有保守的Cyclin_N结构域。
(3)基因重复事件促进了Cyclin基因家族的扩增。通过系统发育分析,我们发现Cyclin基因家族中的各类基因基本上都经历了或多或少的基因重复事件。特别是,在A、B、D、P和T类基因的进化过程中,发生了几次大尺度的基因重复事件。
(4)Cyclin基因的拷贝数目在不同的物种之间存在明显差异。在我们所研究的5个被子植物基因组中,拟南芥有50个Cyclin基因、毛果杨有61个、葡萄有38个、水稻有54个、高粱有49个。然而,通过追踪拷贝数目的变化过程,我们发现这些物种的共同祖先只有30个基因;不同物种基因数目上的差异主要是由于A、B和D类基因在进化过程中,拷贝数目发生了大幅度增加造成的。
(5)内含子丢失在Cyclin基因家族中普遍存在。通过分析外显子-内含子结构,我们发现内含子丢失是造成基因家族成员之间基因组结构差异的主要原因。而且,我们的结构分析结果表明,同一个位置的内含子在进化的过程中可能多次丢失;有的基因相邻的两个或几个内含子可能同时丢失;重复基因之间丢失的内含子可能不同。
2、植物中AGL6类MADS-box基因的系统发育研究。
(1)AP1/SEP/AGL6(AEG)的序列保守性。通过序列比较,我们发现这三类基因序列比较相似,除了具有保守的M、I和K区之外,它们的C末端也存在两个保守的结构域:AP1/SEP/AGL6_motif1和AP1/SEP/AGL6_motif2。
(2)AEG之间的进化关系。系统发育分析结果表明,AP1、SEP和AGL6类基因是通过两次大的基因重复事件产生的。第一次发生在被子植物和裸子植物分开之前,产生了AGL6和AP1/SEP两个亚家族的共同祖先;第二次发生在被子植物起源之前,产生了AP1和SEP两个亚家族。
(3)AGL6类基因的进化。通过增加系统位置重要的基部真双子叶植物的AGL6类基因序列,并充分利用公共数据库中的AGL6类基因序列,我们构建了分辨率较高的系统发育树。结果表明,裸子植物起源之前,AGL6类基因发生了一次基因重复事件,并产生了“Gg1”和“Gg2”两个分支;在核心真双子叶植物中,十字花科起源之前发生了一次基因重复事件,产生了AGL6和AGL13两支;在单子叶植物中,禾本科起源之前发生了一次基因重复事件,产生了OsMADS6和OsMADS17两支;此外,在单子叶植物中还发生了多次近期的基因重复事件。