论文部分内容阅读
PPR(pentatricopeptide repeat protein)蛋白是近年发现的一类RNA结合蛋白家族,从原生生物、藻类到陆生植物和哺乳动物等均有分布,尤其在陆生植物中分布最多,例如拟南芥中含有450多种。PPR蛋白由核基因编码并主要定位到线粒体或叶绿体中发挥作用,参与RNA的转录、剪接、编辑和翻译等多种代谢途径。它们在植物的电子呼吸链传递、光合作用、生长发育以及育性恢复等过程中发挥着重要作用;在人类中,PPR蛋白还与各类神经衰退疾病相关。PPR蛋白由2-30个数目不等的重复基序串联而成,每个基序一般长35个氨基酸,这类基序称为P型基序,研究表明PPR蛋白与靶标RNA序列之间存在模块化识别,即每个重复序列可以特异性地识别一个RNA碱基,基序中第5位和第35位的氨基酸在识别过程中发挥关键作用,这两个位置氨基酸组合称为识别密码。PPR具有应用于RNA操作的潜力,但是由于PPR基序特异性识别RNA碱基的分子机理尚不清楚,限制了PPR作为RNA操作工具的开发进程。为了揭示PPR基序与RNA碱基之间的识别机制,本研究的主要结果如下:1、人工设计出一系列性质均一且可溶的d PPR蛋白。本课题组对拟南芥中所有P型PPR蛋白的基序进行保守性分析,基序上第1-35位上均存在一个最保守的氨基酸,由这些保守氨基酸组成的序列称为d PPR(designer PPR)基序。我们固定其他位置上的氨基酸不变,只改变第5位和第35位,于是得到携带不同识别密码的d PPR基序。我们将10个d PPR基序串联并分别在N端和C端加上一段促进水溶性的NTD和CTD结构域,得到一系列人工设计的d PPR蛋白。实验证明,这些蛋白性质均一稳定,可溶性好。2、揭示了PPR基序与RNA碱基之间互作的对应关系通过EMSA实验,我们筛选到可以分别特异识别四种RNA碱基的d PPR基序:当d PPR基序的第5位和第35位分别为天冬酰胺N和天冬氨酸D时(简称ND),该d PPR基序特异识别RNA碱基U;当d PPR基序的第5位和第35位分别为天冬酰胺N和丝氨酸S时(简称NS),该d PPR基序特异识别RNA碱基C;当d PPR基序的第5位和第35位分别为丝氨酸S和天冬酰胺N时(简称SN),d PPR基序特异识别RNA碱基A;当d PPR基序的第5位和第35位分别为苏氨酸T和天冬氨酸D时(简称TD),该d PPR基序特异识别RNA碱基G。3、解析了d PPR-RNA复合物的晶体结构,揭示d PPR基序与RNA碱基之间的识别机制。为了揭示d PPR基序与RNA碱基之间的识别机制,我们获得了四种d PPR-RNA复合物的结构,其中d PPR蛋白分别识别四条含不同碱基的RNA系列。结构显示d PPR蛋白呈现右手超螺旋构象将RNA包裹在内部,在原子水平上揭示了识别密码与对应RNA碱基之间的特异识别模式。另外非密码氨基酸如第2位的缬氨酸和第13位的赖氨酸分别通过范德华力和静电力在RNA结合过程中发挥重要作用。这一系列研究成果为准确预测自然界中PPR蛋白的靶标序列和研究新PPR蛋白的功能提供了参考,同时对开发特异识别RNA序列的蛋白质工具具有重要意义。