论文部分内容阅读
本研究以CRISPR/dCas9技术为基础,在sgRNA的3′端添加长度为24 bp的捕获序列使之成为捕获sgRNA(Capture sgRNA,csgRNA),与dCas9形成复合物后,csgRNA可以指导dCas9寻靶并结合到目标序列上。利用碱基互补的原理,dCas9-csgRNA复合物上的捕获序列可以与带有互补单链的线性DNA片段发生互作,从而实现了以下实验目的:(1)将带有互补单链的线性CMV片段锚定到目标基因的启动子区,使之以反式增强子(Trans enhancer)的方式实现对目标基因的转录激活,使目标基因表达水平增高,实现特定的细胞生物学目的;(2)使用dCas9-csgRNA复合物在体外靶向结合目标DNA序列,然后借助带有互补单链线性DNA片段的磁珠富集目标DNA后建库测序;(3)使用dCas9-csgRNA复合物在细胞内靶向结合目的DNA(启动子),然后借助带有互补单链线性DNA片段的磁珠富集参与调控目标基因调控的调控序列和转录调节因子。本论文研究内容分为以下三个部分:1.用反式增强子方法实现对目标基因的转录激活从pEGFP-N1载体上扩增出平末端CMV序列(blunt CMV,bCMV),然后使用切刻内切酶在CMV序列的3′或者5′端形成能与csgRNA的捕获序列互补的单链突出序列,制备粘性末端CMV序列(stick CMV,sCMV)。将CRISPR/dCas9及csgRNA表达载体与sCMV片段共转染细胞后,所表达形成的CRISPR/dCas9-csgRNA复合物可识别并结合目标序列,最后sCMV通过碱基互补锚定到目标序列附近(目的基因启动子区),期间csgRNA通过其捕获序列与sCMV互作,将sCMV序列募集到目的基因启动子部位,利用CMV启动子高效率转录目标基因,从而实现指定基因的转录激活。本研究运用该技术在7种细胞中(293T、A549、SKOV3、HT29、HepG2、PANC-1和HeLa)对内源HNF4α基因进行了转录激活;实验结果表明,反式增强子在上述7种细胞系中对HNF4α基因的转录达到10倍以上的激活效率;之后本研究选用另外9种基因作为转录激活的靶基因(TCF3、ASCL1、Ngn2、Oct4、Nanog、TNFAIP3、CASP9、CSF3和Sox2),分别在上述7种细胞中使用反式增强子方法激活目标基因转录和表达;实验结果表明,上述10种基因的转录均可以被不同程度地上调;但是目标基因在不同细胞中表达上调的倍数却具有细胞特异性,造成这种差异的原因可能是这些基因在上述细胞系中的开放程度不同。其中在HepG2细胞和PANC-1细胞中使用反式增强子分别激活HNF4α和TCF3基因的转录表达后,可以发现HepG2和PANC-1细胞均呈现出如下变化:(1)肿瘤标志基因的表达出现下调;(2)细胞周期变化,其中处于G0/G1期的细胞显著增多;(3)正常细胞的功能基因不同程度地上调表达;(4)细胞的迁移和分裂增殖能力下降。以上结果表明可以通过上调肿瘤细胞中的关键基因来实现癌细胞的转良和分化,反式增强子为实现此类肿瘤疗法提供了新方法。而转录因子作为细胞内转录调控网络的核心,将会是这类肿瘤疗法首选的关键基因。相较于以前借助于dCas9激活目标基因转录表达的方法,本研究所采用的反式增强子技术可以实现更高效地激活;反式增强子技术为靶向医疗在靶点选择和验证等方面的工作提供了新的方法和途径。2.靶向富集基因组目标序列本研究利用dCas9-csgRNA复合物,在体外对目标DNA区域进行靶向富集,可以实现:(1)多种csgRNA可以混合后同时使用,对多个目标DNA区域进行高通量富集;(2)从混合样品中靶向富集突变的序列。靶向富集的结果可以方便地进行建库和测序,用于SNP分析。本研究选取6种基因(APOE、AKT1、TP53、IL6、BRCA1和TERT),使用54个csgRNA对这6种基因的外显子区进行靶向富集。该技术包括以下操作步骤:(1)提取基因组DNA并用Tn5酶切标记基因组DNA(该过程成为tagmentation),回收300–1000 bp的目标序列;(2)用dCas9-csgRNA复合物与基因组DNA片段孵育1h后,使用带有互补单链线性DNA片段的磁珠富集dCas9-csgRNA-target DNA复合物;(3)对富集到的目标序列进行克隆测序或建库测序;(4)分析测序结果。经过以上操作可以实现对目标区域的特异识别和富集,通过dCas9-sgRNA复合物与目标序列的完全配对,可以排除样品中相似的家族基因和同源基因的干扰,真正做到精准靶向富集。本研究将不同数量的csgRNA混合后同时用于多靶点DNA序列的富集,经实验验证,混合10个或者54个csgRNA对目标片段的富集效果没有影响。更进一步地,通过改变csgRNA的目标序列使得其更倾向于识别和结合突变的DNA序列,使得csgRNA可以特异地从混合样品中富集突变序列,而排除正常序列,这种方法将有助于在早期及时地检出致病性突变,为此类疾病争取更多的诊疗时间。本方法对目标序列的富集不依赖于目前使用最广泛的核酸杂交方法或PCR扩增方法,对目标序列的特异性抓取是通过CRISPR/dCas9-csgRNA复合物与目标DNA的特异互作结合而实现的,是一种常温非变性温和抓取技术,非常有利于避免核酸杂交方法或PCR扩增方法带来的非特异性噪音片段。可见,本研究为DNA的靶向富集研究提供了一种强大的新技术。3.靶向富集目标基因的调控序列和转录调控蛋白本研究介绍了使用dCas9和csgRNA的表达载体在细胞内表达和组装dCas9-csgRNA复合物,其识别和结合到目标基因的启动子区,然后利用csgRNA的捕获序列,对目标基因的远端调控序列、近端调控序列和结合在这些序列上的转录调控因子蛋白进行富集和鉴别;其中富集得到的核酸序列,使用Tn5转座体构建测序文库后进行高通量测序和分析,蛋白样品则使用Label-free法进行质谱分析,从而对样品中的蛋白种类进行定性鉴定和定量分析。整个富集过程包括以下5个步骤:(1)转染dCas9和csgRNA表达载体,表达的dCas9-csgRNA复合物靶向结合到目标基因的启动子区;(2)甲醛交联细胞,分离细胞核;(3)使用Tn5转座体片段化甲醛交联后的染色质;(4)使用使用带有互补单链线性DNA片段的磁珠分离和富集含有csgRNA的蛋白-染色质复合物;(5)富集产物解交联后,其中的核酸样品建库后进行高通量测序分析,蛋白样品进行质谱分析。使用这种方法,我们在3种细胞中对5个目标基因(HBB、MYC、HNF4α、TCF3和RelA)的调控元件进行分析,获得了更精确地增强子调控元件。本方法不依赖抗体,操作简单,成本低廉,只需要构建好csgRNA表达载体,就可以用于分析目标基因的调控模型,对研究目标基因的转录调控机理提供了新的方法。本研究首次开发了一种可对目标基因调控区进行快速鉴定的新技术。