论文部分内容阅读
基因编码区(CDS)非同义核苷酸(nsSNP)的突变可以导致该区域编码氨基酸的改变,其在蛋白质的进化过程中起着非常重要的作用。尽管如此,对于CDS不同区域的突变与进化模式的相关报道还比较少。因此,本研究以完全测序的哺乳动物和果蝇为研究对象,在全基因组的范围内系统调查了非同义突变(nsSNP)和插入缺失(indel)在这些基因组CDS区的分布情况。研究发现,nsSNP和indel在CDS的边界区域有明显增加的趋势,其多样性的增加量与蛋白质结构域(domain)的分布密度成反比。另外,与CDS的中间区域相比,其对应的5’和3’端区域的同义突变(sSNP)的数量比平均水平低,这也说明CDS的边界区域具有更高的氨基酸可变性。这些证据表明,CDS的中心部分更加保守,而5’和3’端因为具有更高的进化速率而可变性更高。据此,我们认为,由于CDS两端的区域具有更高频率的nsSNP和indel,使得该区域的氨基酸更易发生改变、丢失或增加,从而使得该区域成为蛋白质适应性进化的最前线。因此,对CDS不同区域进化速率的比较,对我们进一步了解蛋白质的进化规律有十分重要的理论意义。