论文部分内容阅读
随着分子生物学的发展,越来越多物种的全基因组序列已为人所知,这使得在基因组间寻找一些共性的遗传痕迹成为可能。而基因组中最基本的特征之一就是碱基频率,已有研究表明基因组中碱基的频率是有物种特异性的。而在漫长的进化过程中,如果序列越短,那其被改变的几率也就越小,因此基因组中的寡聚核苷酸频率被认为是一种保守的遗传标记。
本文通过计算204种真核、原核生物的全基因组序列的1~6阶寡聚核苷酸出现频率,以及50种细菌全基因组序列中的不同片断的二核苷酸出现频率并对其进行保守性、离散度以及相关性检验,试图寻找基因组间出现频率值比较固定的寡聚核苷酸组合。
结果表明,在二核苷酸中,以强—弱碱基组合的类型显得最为保守,而CG的频率则变化最大。更高阶的寡聚核苷酸也出现了相应的特性。基因组不同区段的频率分析表明,同一序列不同部分中这种保守性同样存在。因此,可以认为这些保守的寡聚核苷酸频率是一种进化的痕迹。此外,频率分析中还发现,反向互补的寡聚核苷酸组合的频率值相关度非常高,这也验证了链对称的特性可以在高阶的寡聚核苷酸中存在。