论文部分内容阅读
原核生物中的非编码小RNAs(small RNAs,sRNAs)比人们预想的要多很多。sRNAs能通过RNA结构变化、与蛋白质结合、与其它RNAs碱基配对、与DNA相互作用等机制参与多方面的生物学过程,包括转录、翻译、mRNA的稳定以及DNA的维持和沉默等。目前相关的研究主要集中在模式生物大肠杆菌(E. coli)中,并且已经确定的sRNAs数目达到约80个。近几年,人们利用生物信息学和实验手段,在基因组水平大规模的寻找sRNAs。这是一项工作量十分巨大、并有广阔应用前景的基础研究工作。
根瘤菌(Rhizobium, Bradrhizobium, Mesorhizobium, Azorhizoibum,Sinorhizobium)与豆科植物的共生固氮作用是植物与微生物相互作用的代表性模式。目前已开始在共生植物中大规模寻找microRNAs的研究,而在根瘤菌中寻找sRNAs的研究多是建立在生物信息学的基础上,并且寻找区域也仅限于基因间(intergenic regions)。
本研究利用Experimental RNomies方法,以豌豆根瘤菌Rhizobium leguminosarum biovar viciae248菌株系为材料,提取根瘤菌三个不同生长时期的总RNA,GT法建立其cDNA文库。通过大量实验,我们共获得821条有效序列,利用生物软件数据处理后,共获得418个contigs。其中约有55个contigs序列小于13 bp或代表常规RNAs(tRNAs和rRNAs)。剩余的363个非常规RNA contigs经nucleotide BLAST操作在Rhizobium leguminosarum biovar viciae strain3841全基因组上定位。由此建立的sRNAs文库包括7类contigs:
首先是与所有根瘤菌无匹配序列的“No significant similarity was found”contigs,共有83个(占所有contigs的22.9%)。其中一部分序列长度小于20 bp。推测这类contigs的存在主要是248和3841的基因组特别是共生大质粒的差别造成的。
其次是三类最有可能包含新的sRNAs的contigs,即“Intergenic regions”contigs(69个,19.O%)、“Antisense within gene”contigs(25个,6.9%)以及“overlapping reading flames,or overlap of mRNA with intergenic region”comigs(34个,9.4%)。
最后是三类代表已知基因ORF的部分片段的contigs,包括“Entire mRNA or mRNA middle part” contigs(95个,26.2%)、“N-terminal part of mRNA” contigs(30个,8.3%)和“C-terminal part of mRNA” contigs(27个,7.5%)。其中“Entire mRNA or mRNA middle part”contigs在三类contigs中占优。