论文部分内容阅读
课题组在国际上首次提出构建药用模式植物研究体系,该体系的建立对推动中药现代化研究具有重要意义。丹参(Salvia miltiorrhiza Bunge)为唇形科鼠尾草属多年生草本植物,具有基因组小、染色体数目少、世代周期短、组织培养和毛状根转化技术成熟等特点,在中药活性成分生物合成及调控机制研究中发挥作用,被认为是理想的药用模式植物。丹参基因组和转录组的测定为活性成分生物合成途径的解析及调控机制研究提供基因数据库,其功能基因组学亟需开展创新性研究。本论文联合三代测序技术及二代测序技术,综合利用基因组学、转录组学、生物信息学以及化学等多学科理论与方法,开展丹参根全长转录组研究,鉴定丹参转录本可变剪接现象,探讨基因表达与丹参活性成分合成的一致性,并对合成途径中未知酶的编码基因进行预测。主要研究结果如下:1.丹参全长转录组测序。首次结合三代测序(SMRT)及二代测序(Illumina HiSeq)技术在植物领域解析全长转录本;从组学水平分析药用模式植物丹参的基因可变剪接现象。基于联合测序技术的全长转录组测序共获得636,805条高质量杂合转录本,其N50为2411 bp,而仅用二代测序组装后的转录本N50为1530 bp;联合测序显著提高全长转录本的鉴定效率,以萜类合酶的编码基因为例,二代测序技术仅组装到42%的全长转录本,而联合测序鉴定到71%的全长转录本;融合二代测序reads、杂合转录本、可变剪接位点信息以及丹参基因组信息,检测到4035个基因异构体,并且预测到16,241基因异构体;40%的丹参多外显子基因座位存在可变剪接现象,可变剪接类型复杂多样。2.丹参酮生物合成相关基因的鉴定及预测。研究发现二萜合成相关的SmDXS2、 SmDXR、 SmHDS、 SmHDRl、 SmHDR3、 SmIP11、SmGGPPS1、 SmCPS1、 SmCPS5、 SmKSL1和SmKSL7基因在周皮的表达最高(1og2 ratio≥ 1,FPKM>10),与丹参酮IIA在根不同组织的分布一致,其在周皮的含量分别是韧皮部和木质部的17倍和185倍。因此,丹参根的周皮不仅仅是丹参酮的积累部位,也是丹参酮主要的合成部位。基于丹参基因组,系统分析了可能参与萜类代谢的重要氧化酶/脱氢酶,基因组分别注释到457个CYP450s、144个20DDs和159个SDRs基因;根据丹参酮的合成和积累规律,筛选并预测参与丹参酮合成的15个CYP450s、1个20DD和5个SDRs基因;对候选基因进行克隆分析,构建RNAi和过表达载体,并建立丹参转基因毛状根体系,在丹参毛状根中初步预测候选基因的具体功能。此外,基于丹参全长转录组测序结果,本研究鉴定到丹参酮合成途径的相关基因及候选基因的全长转录本20个,其中6个存在可变剪接现象。3.丹酚酸生物合成相关基因的鉴定及预测。研究发现迷迭香酸合成相关的smPAL1、smPAL3、smC4H1、sm4CL3、sm4cL-1ike1、sm4CL-like4、SmTAT1、 smHPPR3、 smRAs和smCYP98A78在丹参的韧皮部和木质部中的表达量高于周皮,与丹酚酸B在根不同组织的分布一致,其在韧皮部和木质部中的含量是周皮的5倍。因此,丹酚酸在丹参根中主要在韧皮部和木质部中合成和积累。基于此规律以及MeJA对丹酚酸合成的显著诱导,对丹参迷迭香酸合成途径中未知CYP450进行筛选,预测到2个CYP450S可能在丹参迷迭香酸合成途径中催化4-羟基苯乳酸合成3,4-二羟基苯乳酸。基于丹参基因组,对可能参与迷迭香酸聚合为丹酚酸的多铜氧化酶家族进行系统分析,基因组注释到80个编码多铜氧化酶的基因,其中漆酶32个;根据丹酚酸的合成和积累规律,筛选并预测参与丹酚酸合成的多铜氧化酶编码基因5个。此外,基于丹参全长转录组测序结果,本研究鉴定到丹酚酸合成途径的相关基因及候选基因的全长转录本26个,其中11个存在可变剪接信息。4.丹参活性成分合成调控相关poly(A)lncRNA的鉴定及预测。基于丹参根不同组织的转录组数据,鉴定到13,928条丹参lncRNA;基于活性成分在丹参根组织的差异积累及相关合成基因的差异表达,预测44条丹参酮合成调控相关的IncRNA和51条丹酚酸合成调控相关的lncRNA.基于基因组学、转录组学、生物信息学等多学科理论的交叉与融合,建立和完善丹参药用模式植物研究体系,将为中药活性成分的生物合成及调控研究提供新思路,为活性成分合成生物学研究奠定基础,为中药材优良品种选育提供参考,将推动传统药物研究的发展。