论文部分内容阅读
MicroRNA是一种内源性、非编码、小分子(成体一般仅有21-23nt左右)RNA,在转录后起重要的调控作用。它广泛地分布于动物、植物和病毒中,通过抑制或降解的方式对其靶基因的表达进行调解,从而起到影响生物过程的作用。本研究从microRNA基因的数字特征入手,尝试探寻在物种间存在的数字规律。研究分成四部分。
(1)基于microRNA数字特征的物种间差异与相似的研究
microRNA的数字特征在它的发现与识别中起到了至关重要的作用,其基础是在这些数字特征上microRNA具有有别于其它RNA的取值范围,那么这种数字差异是否仍然存在于不同物种的microRNA间呢?也就是说,microRNA的数字特征是否具有物种特异性?为此,我们采用Kolmogorov-Smirnov检验利用132个数字特征对32个物种的microRNA进行了分析,结果表明:物种microRNA在一些特征上呈现出高度的相似,如二级结构匹配状态频率等,这些特征可能是microRNA特异的;而在另一些特征上则呈现较大的差异,如Length、MFE和Stack的个数等,这些特征可成为物种差异的证据。另一方面,我们发现,亲缘关系越近的物种间具有越少的差异特征,反之,亲缘关系较远的物种间则具有较多的差异特征。此外,本研究提出了一种可视化物种间差异的工具:物种间特征差异图谱,通过该图谱可对候选物种在该特征上的相似和差异状况一目了然。我们的研究结果表明在microRNA的数字特征上能够在不同程度或不同范围内体现物种间的差异与相似,这为研究microRNA的进化及物种关系开辟了一条新的途径。
(2)发现动植物间microRNA的数字差异
有研究表明动植物microRNA在发生、剪切和作用机制等方面都存在着明显的差异,那么这些差异会在哪些数字特征的上有所反映以及程度如何呢?这将是我们进行本研究的目的和初衷。我们应用Kolmogorov-Smirnov检验和t测验对mirBase16中的11735个动物microRNA基因和3477个植物microRNA基因的132个数字特征进行了比较研究,结果表明:在候选的132个特征中,有四个特征差异明显,它们是Length、MFE、Helix个数和Stack个数,其他特征在类间差异并不明显,这表明动物和植物的microRNA存在着很多共性的特征。Helix个数的多少将直接影响microRNA结构的构像,从而影响其功能,故这一差异很可能是两类生物microRNA作用方式不同的一个表象,Length、MFE和stack与microRNA的二级结构复杂性有关,从t检验的结果我们发现在上述三个特征的中动物明显低于植物,这说明植物的microRNA的结构复杂性较动物要大,这与前人的研究相符。此外我们发现在二级结构匹配特征中A…、C…、G…和U…等四个频率特征是该类特征中仅有的动物较植物显著低的特征,它们往往对应着二级结构中的loop,loop个数的增多必将导致结构的复杂化,这也是植物microRNA结构较动物复杂的有力证据之一。总之,我们的研究表明,在动植物间存在着明显的差异特征,而这些特征直接或间接地与动植物microRNA的结构和功能相关,因此,这些差异特征是动植物microRNA结构和功能差异的数字表征。
(3)植物microRNA数字特征的基本统计规律
研究从植物microRNA的成体和前体序列的特征出发,尝试探索它们的统计规律。我们采用基本统计作图和方差分析对mirBase16中的3477个植物microRNA进行了分析,结果表明成体序列在从5端到3端的第1、8、19和20位呈现明显的碱基倾向性,尤其是5端U碱基,有近60%的植物microRNA成体选择了U碱基,而G碱基则仅有不足10%的个体选择;有人研究认为microRNA的自由能指数(MFEI)大于0.85,这是microRNA有别于其他RNA的证据,但本研究发现,有30%的植物microRNA的MFEI小于0.85,这表明这一标准已不再适用;基于植物物种的基本分类门、纲、目、科和植物microRNA的11个数字特征进行了分析,结果表明在任一个分类水平上,microRNA的11个数字特征都存在着明显的差异,这说明植物microRNA具有较强的物种特异性。
(4)探索microRNA在植物进化上的数字规律
microRNA的各类数字特征被广泛地应用于microRNA基因的计算识别、筛选和靶基因的预测。大量的研究表明,microRNA基因的数字特征具有其特异性。在本研究中,为了探索microRNA数字特征和进化之间的关系,我们执行了一次大规模分析。我们将方差分析(ANOVA)应用于植物分类的门和科两个水平,对3343个microRNA基因的132个特征进行了分析,结果发现如下三个结论:结论一是在门分类中,候选数字特征被分成了3类,第一类是基于进化保守的;第二类是基于进化上升或下降的;第三类是随进化时间并无明显变化倾向的。结论二是在门分类水平中保守的数字特征几乎在科分类水平中都保守。结论三在门分类中,随进化上升的microRNA数字特征更倾向于与碱基A或U相关,随进化下降的microRNA数字特征更倾向于与碱基G或C相关。进而我们引入PESR测度和主成分分析,科分类水平又证实了结论一和结论三的发现。这些结论证实了在microRNA数字特征和物种进化间存在着紧密的联系,我们的研究将为探索microRNA的数字规律提供一些思路。