论文部分内容阅读
表观遗传学修饰在细胞发育、分化以及癌症等疾病中具有关键的作用,其中DNA甲基化是最重要的表观修饰之一。已有研究表明,DNA甲基化在植物免疫、人类心血管疾病、动脉粥样硬化、自闭症、神经退行性疾病以及肿瘤治疗和肾脏老化等方面都起到非常重要的作用。因此研究全基因组DNA甲基化图谱对于解析DNA甲基化的分布、作用机制以及DNA甲基化与相关疾病的作用关系具有非常重要的意义。本文针对全基因组DNA甲基化数据开展了以下几方面的工作:1.DNA甲基化数据精准比对分析流程软件的开发;2.DNA甲基化数据中SNP检测工具的开发;3.DNA甲基化单倍型组装以及等位差异DNA甲基化区域检测工具的开发;4.DNA甲基化分析流程软件在实际水稻数据中的应用。目前,DNA甲基化研究过程中至关重要的两个关键点是DNA甲基化检测技术以及DNA甲基化数据分析工具的开发。当前主流的能够检测全基因组单位点DNA甲基化水平的测序技术是全基因组重亚硫酸盐测序技术。所以开发相对应的针对全基因组重亚硫酸盐测序数据且简便易用的DNA甲基化数据分析流程软件是非常必要的。DNA甲基化数据分析中最主要的分析包括DNA甲基化数据预处理、数据比对、DNA甲基化单位点水平计算、基因以及转座子等功能元件中的DNA甲基化水平计算、DNA甲基化可视化以及DNA甲基化差异分析。针对以上几部分DNA甲基化数据分析模块,本研究开发了与之对应的应用程序-BatMeth2,并展示在本文第二章节中。BatMeth2会生成一个HTML报告文件,直观的展示了分析的结果,以方便对数据结果的查看。DNA甲基化数据由于经过了亚硫酸盐的处理,未甲基化的胞嘧啶位点会被转换为胸腺嘧啶,因此这将很大程度上增加DNA甲基化数据中检测SNP(单核苷酸多态性)的难度。本文第三章中介绍了本研究中开发的一款在DNA甲基化数据中检测SNP的软件-BSsnpcall,该软件结合DNA甲基化与SNP的所有信息并通过设计新的贝叶斯(Bayes)算法来完成SNP的检测。检测结果显示BSsnpcall检测到的SNP数目比目前常用的两款软件高10%,准确率高5%-25%,并且所需要的运行时间分别只是其他两款软件的1/2以及1/70。等位基因是同源染色体上相同位置控制相对性状的一对基因。等位基因差异表达不仅仅存在于X染色体,例如基因印记,而且同样存在于常染色体,对常见的疾病发生和治疗具有非常关键的作用。DNA甲基化是影响等位基因差异表达的关键因素。本文第四章节中介绍了本研究中提供的一款DNA甲基化结合SNP完成单倍型组装以及等位差异DNA甲基化检测工具-MethyHaplo。结果表明:1)结合DNA甲基化信息和SNP信息完成的单倍型组装长度是仅通过SNP信息进行单倍型组装长度的大约10倍;2)通过将MethyHaplo软件检测得到的等位差异DNA甲基化基因与等位差异表达基因以及已知的印记基因进行重合度比较,结果显示数据之间具有较高的重合度,表明MethyHaplo检测结果的可靠性;3)等位差异DNA甲基化在全基因组范围内主要分布在外显子区域,并且在基因转录起始位置有明显富集;4)等位差异DNA甲基化主要富集在高表达基因上,并且在与转录激活相关的组蛋白修饰区域有更高的分布;5)等位差异DNA甲基化在等位差异CTCF区域有显著富集,并且等位差异DNA甲基化水平与等位差异CTCF水平呈现负相关分布。本文第五章节中介绍了DNA甲基化分析流程软件在水稻数据中的实际应用。通过使用BatMeth2分析了水稻中几种DNA甲基化酶突变体中的DNA甲基化的变化情况。研究结果表明:1)水稻中CG、CHG DNA甲基化主要分布在异染色质,而CHH甲基化更多的分布在常染色质。2)DNA甲基化酶OsDRM2主要负责水稻中的CHH DNA甲基化。3)染色质变构因子OsDDM1a/1b主要负责水稻中的CHH DNA甲基化。4)OsDRM2通过调控MITEs(Miniature Inverted-repeat Transposable Elements)上的CHH DNA甲基化来调控相关基因的表达。5)DNA甲基化酶OsDDM2与OsDDM1能够共同调控水稻中的CHH DNA甲基化。根据DNA甲基化数据分析中的实际需求,本研究开发了DNA甲基化数据分析流程软件、DNA甲基化中SNP检测工具以及DNA甲基化单倍型组装工具,最后本研究将开发的软件BatMeth2在水稻数据中做了应用分析。