论文部分内容阅读
瘤胃是复杂的微生态体系,在反刍动物体内形成严格厌氧的环境。瘤胃中寄居了大量的厌氧微生物,包括细菌、古菌、真菌和原生动物。这些微生物能产生种类丰富的糖苷水解酶,高效降解木质纤维素。随着新一代测序技术的发展,元基因组学和元转录组学技术在环境微生物研究中得以广泛的应用。但是由于瘤胃环境的复杂性导致高质量总RNA的获得比较困难,再加上瘤胃中占优势地位的是瘤胃细菌,而细菌的mRNA没有poly(A)尾巴,因此把仅占总RNA1~5%的mRNA分离出来非常困难,再考虑到测序成本等原因,目前瘤胃元转录组的研究进展缓慢。 本研究通过改进瘤胃样品总RNA的提取方法,获得了高质量的瘤胃样品总RNA,经Agilent2100Bioanalyzer检测,所得到的总RNA完整性较好,符合元转录组测序要求。在此基础上进行了瘤胃微生物元转录组高通量测序,目前已采取454测序完成来自于4头奶牛共5个瘤胃样品的测序,获得了超过336万条reads,平均测序长度在400bp以上。其中两个样品的rRNAreads仅占总测序reads数的1%,进一步证实了我们所得到的总RNA具有较高的质量。 本论文对已完成测序而且获得数据注释的来自3头奶牛的4个瘤胃样品的元转录组数据进行分析。获得的2047271条non-rRNAreads中功能未知的序列约占30%左右,说明瘤胃中存在大量未知功能的新序列;对已知功能基因序列物种来源的分析表明,厚壁菌门是其中最大的微生物功能类群,拟杆菌门、瘤胃真核微生物和产甲烷古菌也是重要的功能类群。通过Pfam-HMM注释,共获得了17339个含糖苷水解酶(GlycosideHydrolase,GH)结构域的蛋白编码序列,这些序列归属于65个糖苷水解酶家族(GHfamilies)。在木质纤维素降解酶系中,GH1、GH3、GH5、GH8、GH10、GH26、GH43和GH51等家族蛋白编码基因表达相对稳定,在不同的元转录组样品中相对比例变化不大。与元基因组的研究结果相比,GH48家族蛋白在元转录组中的表达丰度明显增高。 对木质纤维素降解酶基因的元转录组分析表明,纤维素酶系的相对丰度较高但在不同元转录组样品中差异明显;半纤维素降解酶系和去分支酶系的相对丰度在不同样品中较稳定,其中木聚糖酶、β-半乳糖苷酶(β-galactosidase)和α-L-阿拉伯呋喃糖苷酶(α-L-arabinofuranosidase)的表达量较高。木质纤维素降解功能基因对应的物种分析显示,瘤胃球菌(Ruminococcus)和丝状杆菌(Fibrobacter)是主要的纤维素降解菌,瘤胃厌氧真菌和原生动物也在纤维素降解中发挥主要作用;半纤维素降解主要由瘤胃细菌完成,参与降解的微生物种类多样且没有明显优势的类群。此外,元转录组中获得的木质纤维素降解酶相关序列中约72%与已知基因序列的相似性低于75%,表明获得的数据具有较高的新基因发掘潜力。 4个元转录组数据一共获得了761条编码GH48蛋白的基因序列,MEGAN的物种来源分析显示其中81%的序列都是瘤胃球菌来源的。这些序列和已知GH48序列相似性为32.94~100%,其中63%的序列和已知序列的氨基酸相似性≤75%,表明可能存在新的gh48基因序列。通过设计gh48基因保守引物,以2个不同牛的瘤胃样品总DNA和cDNA为模板进行PCR扩增,建立gh48基因的4个克隆文库,总共获得了455条gh48基因序列。以89%作为gh48基因种类区分的标准,我们共获得66种不同的gh48基因。系统聚类树结果显示,分别聚为5个相对独立的类群,其中新类群C中OTU65所代表的序列是cDNA克隆文库中的优势序列,分别占两个cDNA克隆文库的36.4%和19.5%。这提示瘤胃细菌gh48基因具有丰富的多样性,同时,其中也存在优势表达的GH48家族蛋白。 本论文还对丁酸合成相关基因/基因簇进行了研究,发现了3种新的丁酸合成中心途径基因簇的排列形式。