论文部分内容阅读
香菇(Lentinula edodes)是世界上广泛栽培的食用菌之一,具有较高的食用与药用价值。作为一种典型的白腐菌,香菇能降解植物中木质纤维素等大分子物质,从而满足自身的营养与生长需求。对香菇基因组进行De novo测序与分析,有利于从基因组层面上阐述香菇的生物学特性,为香菇栽培和育种研究奠定基础。特别是对香菇基因组中与木质纤维素降解相关基因的挖掘与分析,能从一定程度上解释香菇的基质降解能力,有利于评估香菇利用农作物秸秆进行栽培的潜力。 1.使用Illumina Hiseq2000测序平台对插入片段长度分别为180bp、500bp、2kb、5kb和6kbp的5个香菇菌株W1-26的DNA文库进行了测序,共获得测序深度约230倍基因组碱基覆盖度的Clean data,再利用ALLPATHS-LG软件进行了基因组De novo组装。对组装结果进行补洞和Scaffolds连接等优化后,获得了大小为41.8 Mb、N50长度为301Kb的基因组Scaffolds序列。 2.对香菇基因组进行了结构注释和功能注释。结果表明,香菇基因组中重复序列含量高达16.24%,其中LTR/Gypsy类型的重复序列最多,占基因组大小的7.32%。此外,从香菇基因组序列中鉴定出301个tRNA基因、2个18s rRNA基因和3个28s rRNA基因。使用Augustus、GeneMark-ES和SNAP等软件进行ab initio基因预测,同时利用转录本序列和近缘物种同源蛋白序列对香菇基因组序列进行比对,共得到14,889个编码蛋白基因模型。其中,35.82%的基因被检测出具有可变剪接;84%的基因能被Nr、Swissprot、KOG、Pfam、InterPro、CDD、GO和KEGG等公共数据库进行功能注释。 3.根据香菇基因组注释信息,搜寻到了位于Scaffold1序列上交配型A位点,以及位于Scaffold53序列上的交配型B位点。其中A位点包含紧挨在一起且基因方向相反的HD1和HD2基因,B位点包含密集排列在一起的5个信息素受体基因和5个信息素基因。此外,对香菇特殊香味物质1,2,3,5,6-五硫杂环庚烷的代谢相关基因进行了挖掘,在基因组中鉴定出7个γ-谷氨酰转肽酶基因和5个半胱氨酸亚砜裂解酶基因。香菇中这两类基因的数目远多于本课题的其它供试真菌。 4.进行了香菇与25个真菌物种比较基因组学分析,使用OrthoMCL对它们进行同源基因分析,将全部基因聚成了25,334个基因家族,并根据其中756个单拷贝同源基因家族进行了物种间系统发育分析和分子钟分析。,在25种真菌中与香菇最相似的物种是裸脚盖菇Gymnopus luxurians,两者分化于3900万年前,它们的基因组有着高度的共线性。对家族数目不少于13的7,194个基因家族进行扩张和收缩分析,发现42个基因家族是在香菇中基因数目不少于10个的扩张家族。在42个基因家族中21个没有基因功能注释信息,11个与逆转座相关。 5.在香菇基因组中鉴定出102个与木质纤维素降解相关的CAZYme基因,其中包括38个纤维素酶基因、9个半纤维素酶基因、7个果胶酶基因、24个木质素氧化物酶和24个木质素降解辅助酶基因。这些基因的数目与裂褶菌(Schizuphyllum commune)和黄孢原毛平革菌(Phanerochaete chrysosporium)等典型的白腐菌非常接近。 6.将香菇菌丝分别在葡萄糖和纤维素培养基中培养120 min,然后进行转录组测序与比较分析,发现香菇菌丝在纤维素培养基中上调表达的基因在CAZYme和转录因子基因中存在富集,表明在不同碳源的培养基质中,香菇菌丝对碳源利用的模式和分子机理可能存在差异。此外,在香菇基因组中找到了一些对纤维素降解相关的关键基因,其中包含2个纤维素酶基因和22个转录因子基因。 7.根据香菇的基因组与转录组数据,以网页形式搭建了香菇基因组数据库(http://legdb.chenlianfu.com)。数据库能以网页形式提供对香菇基因组序列和注释信息的下载;以Blast本地化的方式提供了对基因组序列的比对;以Gbrowse2方式提供了对基因组信息的浏览。香菇基因组数据库的搭建,有利于推动香菇分子生物学的深入研究和学术交流。 对香菇基因组信息的剖析和挖掘,能为香菇的遗传育种、栽培学研究和分子生物学研究奠定坚实的基础。