论文部分内容阅读
哺乳动物生殖细胞的同源重组发生在第一次减数分裂的前期,非姐妹染色单体之间发生交叉互换,这是导致遗传多样性的一个重要原因。同源重组分成两种情况,一种是同源染色体之间双向交换DNA分子,这被称作交叉互换,另一种是一条同源染色体向另一条同源染色体单向传递DNA分子,这被称为基因转换。如果同源重组过程出现问题,就会引起后代产生相应的疾病,例如人群中出现的染色体三体综合征就是因为在减数分裂的同源重组过程出现问题最终没有把中间体分开而导致的。由此可见,同源重组和我们每个人的身体健康状况都息息相关,对同源重组现象的深入研究是很有必要的。但是目前对于减数分裂中同源重组的研究还缺乏能够直接观察的有效的实验手段,而通过统计学的方法计算推导重组率,需要建立在群体遗传学大样本的基础上,一般只能得到大比例尺上的重组率,而在精细尺度上的高分辨率的重组率是不能通过这种方法计算出来。我们希望通过DNA测序的方法,找到精细尺度上高分辨率的同源重组事件,但是二代测序技术读长短的特点不利于同源重组事件的发现。目前主流的二代测序技术来自Illumina公司,Illumina公司的测序仪中,读长最长的是Miseq系列,只能达到双端300bp的长度,而且Miseq系列测序仪属于桌面式测序仪,与Hiseq系列测序仪比起来通量较小,测序成本较高,准确率和稳定性较低。而Illumina的其他测序仪,读长最长的都是双端150bp。这样的读长长度想要对同源重组事件进行识别是远远不够的。第三代测序技术中,最具代表性的当数Pac Bio公司的SMRT技术,它的读长可以达到几十kb到上百kb,长度非常的长,但是单碱基的错误率很高,要想获得高精度的数据需要加大测序深度,这样成本就会急剧上升,而且第三代测序技术整体还不够成熟,不如二代测序系统稳定,后续的分析软件也不够成熟。我们采用Long Fragment Read的方法,利用二代测序技术得到10kb左右长读长的DNA序列。我们用Illumina的Tru Seq合成长读长DNA文库构建试剂盒,构建了杂合小鼠精子DNA的长读长文库,通过Illumina的Hiseq2500测序仪对文库进行了测序,随后经过生物信息学分析,发现了在精细尺度上的全基因组范围内的小鼠精子DNA的同源重组事件,再分析该杂合小鼠精子DNA的普通全基因组测序数据,发现潜在重组片段,随后的分析发现潜在重组片段中包含的同源重组事件数目明显大于包含的随机片段数目,与预期相符,证明了发现的同源重组事件可信度高,我们的同源重组事件识别算法分有效。据文献报道PRDM9组蛋白甲基转移酶与同源重组之前必须发生的双链断裂的形成有关,通过MEME软件分析得出PRDM9蛋白基序在同源重组区域有富集。通过分析同源重组事件在基因组上的位置,发现同源重组事件在外显子和内含子中含量少,而在基因间和基因上下游等区域的含量多。同源重组事件倾向于发生在非功能区或者说是功能小的区域,与以前的文献报道相一致。结论:我们通过Illumina的Truseq合成长读长DNA文库构建试剂盒构建了杂合小鼠精子DNA的长读长文库[1],用二代测序的方法得到了10kb左右长度的基因组DNA序列信息,并成功在精细尺度上(20bp~5Kb的范围内)识别出了全基因组范围内的同源重组事件,并证明了结果的准确性。对这些同源重组事件的进一步研究,发现其倾向于发生在基因间和基因上下游等功能较小的区域,而避免发生在外显子和内含子等功能比较重要的区域。