论文部分内容阅读
生物信息学(Bioinformatics)是将生物学与计算机科学、数学等相结合而形成的新兴学科。近年来,分子生物学的进步带动了生物信息学的发展,并将其应用到药用植物领域,为中药研究提供了新的研究手段。本研究将生物信息学应用到药用植物基因组、后基因组和分子鉴定研究,对其中的关键生物信息技术进行了开发、比较和分析。基因组是对药用植物进行系统的生物学研究的基础。本研究对药用植物基因组中的生物信息学技术和算法进行了研究。在基因组组装方面,基于重叠图的组装策略构建了基因组组装流程,并使用物理图谱进行组装结果验证和优化,以紫芝为例,构建得到48.9Mb的紫芝基因组,共12条染色体序列。在基因预测方面,使用基于隐马尔可夫模型的从头预测和基于证据的预测方法相结合的方式,提高了基因预测的准确性。在基因功能注释方面,使用Smith-Waterman算法和隐马尔可夫模型相结合的方法构建了基因功能注释流程,可搜索Nt、Nr、Swissprot、COG数据库进行同源分析,搜索KEGG数据库进行代谢通路分析,搜索Pfam和InterPr0进行结构域和基因功能分析。此外,本研究还通过基于后缀树的基因组比较研究,发现紫芝和赤芝基因组结构基本一致,但发现它们的某些染色体之间存在结构差异,有可能在进化过程中发生了染色体重排事件。本研究使用最大似然法构建了基因组水平的系统进化树,并基于化石证据对灵芝的进化时间进行估计,发现灵芝属的分化时间约为3800万年前。此外,本研究编写了基因簇挖掘算法,并对紫芝PKS和TPS基因簇进行挖掘。后基因组学,也被称为功能基因组学,主要围绕基因功能及其调控机制展开研究。本研究使用生物信息学技术和算法对差异表达基因以及RNA编辑、小RNA和DNA甲基化进行了全基因组水平的分析。我们使用基于负二项分布检验的方法建立了基因差异表达分析流程,并对差异基因进行GO和KEGG富集分析,结果显示,紫芝菌丝期和子实体期有76个基因具有明显的表达差异,并且与次生代谢产物的生物合成相关。RNA编辑机制通过改变RNA的碱基形式对基因进行调控,本研究基于单核苷酸变异发现方法建立了RNA编辑位点预测流程,包括对编辑类型进行分类,计算编辑度,对编辑位点附近的基因进行注释和富集分析。小RNA是另外一类基因调控机制,它通过与转录本结合特异性地降解转录产物,从而抑制基因表达。本研究建立了小RNA的分析流程,包括对小RNA进行分类、与参考基因组进行比对、并对小RNA的潜在靶基因进行预测。另外,基于重硫酸盐处理的方法,我们建立了一套DNA甲基化分析方法识别甲基化位点。生物信息学在药用植物DNA条形码研究中的应用包括DNA条形码鉴定算法研究和DNA条形码数据库构建。本研究使用种内种间遗传距离,"barcoding gap’和Wilcoxon秩和检验对不同DNA条形码候选序列的种内和种间变异程度进行评估,以筛选出适合于特定类群的DNA条形码序列。本研究使用基于Smith-Waterman算法的BLAST方法和基于Needleman-Wunsch算法的最近距离方法进行DNA条形码序列鉴定,根据研究结果,BLAST方法速度快、精度高,更适用于DNA条形码鉴定。生物信息学通过构建数据库对大量数据进行存储、整理和分析。本研究构建了药用植物基因组数据库和中药材DNA条形码网络鉴定系统。对于药用植物基因组数据库,使用MySQL数据库语言对基因模型、基因注释等信息进行存储,创建了基因组浏览器,对基因组结构信息、基因位置信息、转录本比对信息进行查询。该数据库还提供了基因簇发掘工具,用于基因簇分析,编写了可视化软件用于展示基因在染色体上的相对位置。本研究运用BLAST鉴定方法和计算机编程语言构建了中药材DNA条形码鉴定系统,为DNA条形码鉴定提供参考序列和鉴定方法。该系统目前包含的序列涉及中国药典、美国药典、日本药典、韩国药典、欧洲药典和印度药典的药材及其混伪品。ITS2和psbA-trnH序列分别为73,800条和31,241条。通过使用网站的物种鉴定功能,用户能够使用查询序列与数据库进行比对,系统将返回与查询序列特征相近的匹配结果,为药材鉴定提供参考。在本研究中,生物信息学技术在药用植物基因组、后基因组和分子鉴定研究中得到充分应用。在组学研究层面,建立了组学研究的生物信息学方法,丰富的数据和分析结果为后期开展进一步研究提供了基础。在分子鉴定层面,将BLAST算法用于DNA条形码鉴定,并通过构建DNA条形码数据库进行条形码数据整合,为数据的有效利用提供平台。总之,生物信息学可广泛应用于药用植物研究中,并促进中药现代化和全球化进程。