论文部分内容阅读
油桐是我国特有的木本油料树种,所产桐油经济价值特高,广泛应用于高级油漆、涂料、油墨等制造业,又可供制生物柴油、树脂、人造橡胶、皮革、塑料、颜料及医药等。油桐种质资源是我国特有的基因资源,在基因表达水平开展对油桐品质及产量形成相关基因的研究,对油桐分子育种具有重要的理论意义和实践价值。本文以油桐对年桐品种为试材,构建种子cDNA文库、EST文库,并对EST序列进行全面分析,对重要基因全长cDNA克隆等方面进行了研究,主要结果有:(1)油桐近成熟种子cDNA文库的构建。采用Unizol方法提取总RNA,经Oligotex mRNA kit分离并纯化得到mRNA,在SuperSciptTM ⅡRnaseH-Reverse Transcriptase等的作用下合成cDNA,与pBluescriptⅡSK(+)XR载体连接重组并转化感受态细胞DH10B,成功地构建了油桐对年桐近成熟种子的cDNA文库。文库总容量为8.53×106,重组率为88.95%,插入片段长度500-1500bp。构建的文库质量高,为进一步建立油桐EST文库、开展基因分离鉴定、制作油桐基因芯片和基因表达检测等奠定了良好基础。(2)油桐近成熟种子EST文库的构建。以构建的油桐对年桐近成熟种子cDNA文库为材料,随机挑选3203个阳性克隆进行5’端测序,获得了具代表性的表达序列标签(EST)。经分析、整理,获得3202有效EST序列,平均长度554bp,500-700bp的ESTs占73.6%;在线CAP3拼接,共获得876个非冗余基因序列,其中重叠群202,单一EST序列674。重叠群的EST拷贝数从2个到106个不等,拷贝数为2的最多,达81个;拷贝数为3的有29个;拷贝数7个以上的出现频率多为1或2。油桐对年桐品种的EST文库系国内首次构建,为油桐功能基因组及遗传改良等的进一步研究提供了资源基础。(3)油桐EST序列功能注释。3202个有效EST序列中,1954个为功能已知基因序列,423个为功能未明确的基因序列,760个为相似性较低的基因序列,44个为没有重要相似性的基因序列,21个非植物类基因序列。1954个功能已知的基因序列中,非冗余基因序列467个,包括重叠群序列176个,单一序列291个,涉及379种功能基因;其中与油桐本种同源的序列133个,与同属千年桐同源的序列349个;与大戟科变叶木等11种植物同源的序列1347个。与其他科属植物同源的序列125个。(4)油桐种子EST文库已知功能基因表达分析。油桐近成熟种子表达的379个已知功能基因归为物质代谢、能量代谢、细胞生长发育、转录、蛋白质合成、蛋白质定位与贮藏、载体、细胞结构、信号转导、抗病与防卫、次生代谢及未分类基因等12大类,蛋白质合成相关基因的表达最丰富,占49.6%,蛋白质定位与贮藏蛋白相关基因占21.9%,抗病和防卫相关基因占8.1%;其他各类的相关基因表达量均不足5%。说明材料采集时油桐种子正处蛋白质合成与贮藏高峰期。其中与脂肪酸代谢相关的功能基因有Δ12油酸脱饱酶(FAD2)、B-酮脂酰ACP合成酶(KASI)、烯脂酰基酰基载体蛋白还原酶(EAR)、参与柠檬酸穿梭的苹果酸脱氢酶、2,4-二烯脂酰CoA还原酶、3-酮脂酰辅酶A硫解酶、脂肪酸β一氧化多功能蛋白等,其中Δ12油酸脱饱酶(FAD2)基因属高丰度表达。与油脂贮藏相关的油体蛋白Oleosin基因高丰度表达。与贮藏蛋白相关的基因有蛋白A3前体、豆球蛋白B前体、11S球蛋白β亚基前体、豆球蛋白类蛋白、种子贮藏蛋白等,多为高丰度表达。与抗性相关的基因35种,主要有金属硫蛋白、热激蛋白、亲环素、脱水素、翻译控制肿瘤蛋白、富含脯氨酸蛋白、谷胱甘肽过氧化物酶等高丰度表达的基因。与能量代谢相关的基因主要有果糖二磷酸醛缩酶、磷酸甘油酸激酶、磷酸葡萄糖变位酶、二氢硫辛酰胺脱氢酶、丙酮酸脱氢酶、琥珀酸脱氢酶等低丰度表达的基因。与蛋白质合成相关基因64种,主要有18S核糖体RNA、26S核糖体RNA、小亚基核糖体RNA、30S核糖体蛋白、40S核糖体蛋白、50S核糖体蛋白、60S核糖体蛋白、翻译起始因子等;与氨基酸代谢相关的序列4条。与蛋白质结构相关基因17条,主要有前折叠素相关蛋白、蛋白质二硫键异构酶、泛素等。与信号转导相关的基因序列32条,涉及23种功能基因。与基因转录相关的基因序列36条,涉及24种功能基因。与次生代谢相关基因23种44条序列。与物质转运相关基因序列23条。(5)油桐FAD2基因的全长cDNA克隆。所克隆的FAD2基因序列长1537bp,含长度为1146bp的完整编码序列,编码383个氨基酸。其氨基酸序列有3个多变区,N端的起始段6个氨基酸为信号肽序列,3个组氨酸簇高度保守。酶蛋白分子量44144.4Da,等电点p18.57,有5个跨膜结构域,说明FAD2为膜结合酶,在N端、C端及中间各有一强亲水区,为膜外结构区;中间若干区段为疏水区,为膜内结构区,组氨酸簇位膜表面,二级结构中α螺旋主要位于肽链C端,β折叠链较短,卷曲主要位于肽链N端。(6)油桐核糖体蛋白及rRNA基因的全长cDNA克隆。60S核糖体蛋白L8的基因序列长1086bp,含有长783bp的完整编码序列,编码261个氨基酸。氨基酸序列近N端和近C端高度保守,C端尾部变化较大。酶蛋白分子量28175.3Da,pI11.44,为碱性蛋白。N端、C端各具强亲水性,中间则亲水区与疏水区相间。二级结构上,卷曲主要位于肽链的中部,β折叠链较短,α螺旋较少,主要位于N端和C端。18SrRNA基因序列全长2523bp,26SrRNA基因序列长2933bp。不同产地和不同生存环境的物种,其rRNA基因有不同的碱基组成,亲缘关系越近的物种间碱基相似性越大,构建rRNA基因进化树是检测物种基因同源性和鉴别物种有力的辅助工具。26SrRNA和18SrRNA分别参与到核糖体大小亚基的自组装形成中,rRNA分子内有大量的反向互补序列,形成大量局部双链区并自卷曲和折叠而形成稳定的“茎环状”结构。rRNA分子结构有大量链内双链区,双链间有较小的内凸环,侧凸环成链的拐点,较大环则成为双链定向的环岛,双链末端为发夹结构,呈长臂状的“吸臂”,这有利于rRNA分子与核糖体蛋白结合形成结构稳定的核糖体亚基。