论文部分内容阅读
脂肽类抗生素达托霉素对MRSA、VRE、VRSA等耐药菌都有很强抑菌效果,已被FDA批准用于治疗由革兰氏阳性菌引起的皮肤和皮肤组织感染,以及由金黄色葡萄球菌导致的菌血症和心内膜炎,具有广阔的应用前景。链霉菌HCCB10043能够产生达托霉素的先导化合物A21978C。为了了解HCCB10043产生次级代谢产物的潜能以及与A21978C合成相关的基因,本论文对HCCB10043的基因组草图进行了测序,在此基础上对基因组进行挖掘发现了脂肽类抗生素arylomycin的生物合成基因簇并对簇内相关基因的功能进行了研究。同时,本文还对参与脂肽类抗生素脂肪酸侧链合成的基因及影响A21978C产量的因素进行了探讨。具体内容和结果如下:1.基因组测序分析及次级代谢产物生物合成基因簇挖掘利用Solexa测序技术对]HCCB10043进行基因组测序,最终共拼接得到449个scaffolds,总长8.65 Mb。在该基因组中,共预测得到6145个编码蛋白基因,其中5584个预测蛋白与S. roseosporus的蛋白同源,3987个蛋白可以比对到COG数据库中。除了A21978C生物合成基因簇外,在HCCB10043基因组中还发现有12个次级代谢产物合成基因簇,其中包括4个NRPS基因簇(N1-N4)、3个PKS基因簇(P1-P3)、3个NRPS-PKS杂合基因簇(NP1-NP3)及2个非NRPS/PKS类基因簇(01-02)。其中N2簇、P3簇、NP3簇、01簇及02簇分别参与尿苷肽类抗生素napsamycins、烷基苯醌类化合物、联二吡啶类抗生素collismycins、铁载体desferrioxamine E及含磷抗生素FR900098的生物合成,其余基因簇的功能还不清楚。对上述基因簇内相关基因在三种培养基中不同时间点的转录情况进行RT-PCR分析,结果显示,所挑选基因在培养基F1和F2中48h时几乎都处于较高的转录水平,说明这些基因簇处于“活性”状态,具有合成次级代谢产物的潜力。2.功能未知基因簇代谢产物研究对于HCCB10043基因组中代谢产物未知的基因簇,选取在F1和F2培养基中转录水平较高的N1、N4、NP2以及P2簇进行研究,分别构建了簇内基因n1-1、n4-1、 np2-1及p2-1的缺失突变株。发酵产物分析表明,除了△n4-1外,其它突变株的代谢情况较HCCB10043没有明显变化。与HCCB10043相比,△n4-1发酵液中缺失了4个化合物,它们分别为arylomycin A2、A4、A5及A6,说明N4簇为arylomycin生物合成基因簇。以HCCB10043及S. roseosporus基因组序列为参考,设计引物扩增完善了N4基因簇。该基因簇共包含10个ORF,其中aryA、aryB和aryD编码NRPSs,负责arylomycin中六肽链的组装合成。aryF、aryG和aryH分别编码羟基扁桃酸合酶、羟基扁桃酸氧化酶和羟基苯甘氨酸氨基转移酶,与chloroeremomycin生物合成基因簇中HPG(对羟基苯甘氨酸)合成基因有很高的相似性。AaryF发酵产物分析表明,该突变株不能合成arylomycin,而当在培养基中加入HPG时,突变株回复arylomycin产生能力,证明该基因的确参与arylomycin中非蛋白源氨基酸HPG的生物合成。在arylomycin生物合成基因簇中,aryC编码的P450酶与参与联苯键形成的HmtS、P-450mel及OxyC等都具有44%以上的氨基酸相似性。为了验证AryC是否参与arylomycin中HPG和Tyr残基之间的苯C-C连接反应,我们首先构建了ΔaryC突变株。发酵结果显示,ΔaryC不能产生arylomycin,而是合成了缺少联苯键和Tyr残基的新型线性脂五肽化合物。生物活性分析表明,线性脂五肽失去了对Staphylococcus epidermidis的抑菌作用,说明arylomycin的C端结构对其抗菌活性有重要影响。随后,又构建了含有完整aryC基因及其启动子的互补质粒pLAC1,将其导入ΔaryC后,互补突变株回复arylomycin的产生;aryC的缺失和回补实验表明其与arylomycin分子中HPG残基与Tyr残基之间联苯键形成相关,并且它的的作用时间早于硫酯酶TE结构域催化肽链从NRPS上释放的时间。Arylomycin作用于细菌的Ⅰ型信号肽酶(Spase I),除Spase I发生突变外,在一些微生物中还发现有其它未知的arylomycin抗性机制存在。为了确定编码ABC转运蛋白的aryl和aryJ是否与arylomycin抗性相关,我们分别构建了Δaryl和ΔaryJ突变株。形态观察表明,aryl和aryJ缺失后,突变株在MS平板上的产孢能力减弱。然而,在ΔaryF的基础上敲除aryl和aryJ发现,在阻断arylomycin合成的情况下,aryl和aryJ缺失并不会影响突变株孢子的形成,这些现象说明除了Spase I突变外,aryl和aryJ也同样可以提高HCCB10043对arylomycin的抗性。3. fabH及bkd.在A21978C和arylomycin脂肪酸侧链合成过程中的作用脂肽类化合物A21978C和arylomycin的主要组分中都含有支链脂肪酸侧链,而在它们的生物合成基因簇中并没有与脂肪酸侧链合成相关的基因。达托霉素是A21978C的正癸酰衍生物,其脂肪酸侧链为n-C10,通过在培养基中添加癸酸前体获得。为了确定参与A21978C和arylomycin脂肪酸侧链合成的基因以便对其进行改造并提高发酵液中侧链为直链脂肪酸的组分(达托霉素)的比例,我们对基因组中脂肪酸合成必需基因fabl及参与支链氨基酸代谢的bkd基因在A21978C和arylomycin合成过程中的作用进行了研究。在HCCB10043中共有7个fabH同源基因,其中一个与fabD、fabB、acpP成簇存在,为初级代谢中脂肪酸合成所必需。为了确认fab基因簇外的6个fabH否参与A21978C和arylomycin脂肪酸侧链的合成,分别构建了这6个fabH的单一基因缺失突变株和多基因同时缺失突变株。发酵结果表明,fab基因簇外fabH缺失并不影响A21978C和arylomycin产生,说明它们不参与A21978C和arylomycin脂肪酸侧链的合成。为了进一步验证fab基因簇内的fabH是否负责A21978C和irylomycins中脂肪酸链的合成,也为了降低HCCB 10043支链脂肪酸合成能力,我们尝试了对fab基因簇内fabH基因进行替换,首先构建了能够表达大肠杆菌fabH基因(ecfabH)的质粒pWMH-ecfabH1-4,将其导入HCCB 10043后,再利用同源重组方式敲除fab基因簇中的fabH。PCR结果显示,挑选的近200株双交换菌株都为回复突变株,推测该fabH对细胞的生长代谢至关重要,当用ecfabH对其进行替换时,可能会对细胞造成不利影响。在HCCB 10043中共有两个bkd基因簇:bkdA1B1C1和bkdA2B2C2。为确认它们在A21978C和arylomycin合成过程中的作用,我们构建了bkdA1B1C1和bkdA2B2C2的缺失突变株。突变株发酵结果显示,AbkdA2B2C2仍能正常合成A21978C和arylomycins组分,而AbkdA1B1C1失去了这种能力,转而合成各组分侧链为直链脂肪酸的同分异构体。回补bkdA1B1C1基因或者在发酵培养基中添加异丁酸和2-甲基丁酸可以回复AbkdA1B1C1突变株A21978C和arylomycin支链脂肪酸侧链组分产生,说明A21978C和arylomycin组分中支链脂肪酸侧链的合成前体是由BkdAlB1C1代谢Val和Ile提供的。当尝试在ΔbkdA1B1C1突变株培养基中添加癸酸时,菌体自溶过早而没有积累达托霉素,这可能是由于大量直链脂肪酸参入到突变株细胞膜中导致其强度下降从而不能抵抗癸酸的毒性。4.A21978C产量差异突变株A9及C4转录组测序分析和差异基因验证为了确定影响A21978C产量的因素为菌株改良提供方向,利用RNA-seq技术对A21978C高产菌株A9和低产菌株C4发酵培养48h的转录组进行分析比较。RNA-seq结果表明,C4与A9之间共有66个共表达差异基因(BDEG1-66),其中10个在A9中表达上调,56个在A9中表达下调。此外,还有494个基因仅在A9中表达,579个基因仅在C4中表达。利用RT-PCR对A21978C生物合成基因簇中相关基因的转录情况进行分析,结果表明,A21978C结构合成基因及抗性基因在C4和A9中的转录水平没有太大差异,与RNA-seq结果一致,说明C4和A9之间A21978C的产量差异并不是由这些基因的高或者低表达造成的。选取差异基因BDEG4、DEG14、BDEG22、BDEG28、BDEG41及BDEG61进行RT-PCR验证,它们在C4及A9中的变化趋势与RNA-seq结果一致,说明RNA-seq结果比较可信。从这些已验证的差异基因中挑选BDEG14(glpK)和BDEG28 (ssgG)做进一步研究。以C4为出发菌株,敲除其中的glpK并不会影响A21978C的产量,而敲除ssgG会导致突变株的A21978C产量较C4提高10-30%,说明A9中ssgG基因表达下调是其A21978C产量提高的一个原因。另外,RNA-seq结果表明,A9相对于C4共含有425个SNV(单核苷酸变异)位点,其中一个存在于核糖体S12蛋白编码基因rpsL的第129位(由G突变为T)。该SNV的出现使得A9对链霉素和卡那霉素的抗性较C4有了很大的提高;同时,该SNV与报道的经核糖体工程改良后A21978C高产菌株rpsL基因中的SNV相同,说明该突变也是A9的A21978C产量高于C4的重要原因。