论文部分内容阅读
真核基因的转录调控是一个复杂的过程,这个过程涉及到很多转录因子以及她们在DNA上的结合位点或称模体之间的相互作用,因此转录因子及其结合位点是研究基因转录调控的两个关键因素。邻近的两个转录因子之间,往往会有相互作用,这种相互作用或组合调控关系,反映到DNA序列上,即是它们的结合位点具有共同出现的特征。迄今为止,虽然对真核基因的转录调控已有不少研究结果,但是还未彻底掌握其调控机制,尤其是对其组合调控规律的认识。与其它基因相比较,核糖体蛋白基因具有共调控的特征,对其组合调控特征的研究可以更好地理解基因转录调控的机理。因此为了能够对酵母基因上游序列有一个系统而全面的认识,本文基于马尔可夫模型分别针对酵母核糖体蛋白基因和非核糖体蛋白基因探测了上游潜在的调控模体(转录因子结合位点),并对这些调控模体间可能存在的组合调控关系进行了分析。
首先,我们以酵母核糖体蛋白基因和非核糖体蛋白基因上游启动子序列为样本,利用基于马尔可夫链模型的Z-score统计量,分别抽提出样本中潜在的调控模体,结果发现这两组模体与实验得到的转录因子结合位点符合率均达到95%。其次,分别对每一组中的模体两两配对,并与背景序列比较,找出在样本中出现概率及距离分布均具有统计显著性的模体对,我们推测这些非随机出现的模体对具有潜在的组合转录调控功能,其中,酵母核糖体蛋白基因中一些模体对的组合调控作用已有实验支持。第三,对核糖体蛋白基因上游序列中潜在的组合调控模体对在序列中的位置和距离分布情况进行分析,结果发现近94%的模体对位于转录起始位点上游,超过半数的模体对之问的距离在0~100bp之间,其中,距离小于30bp的模体对接近30%,这表明短距离的问隔可能更有利于两模体的相互作用。此外,我们发现模体对分布在序列的正链或者分别在正链和负链上的概率都接近50%,而只分布在负链上的较少,这表明相互作用的模体之间具有方向上的偏好性。这些结果将有助于我们对酵母基因的转录调控机制的认识。