癌症基因组和转录组测序数据分析方法研究

来源 :中国科学院北京基因组研究所 | 被引量 : 0次 | 上传用户:lydia1122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结构变异是指存在于基因组中的大片段的插入、缺失、倒位、易位和拷贝数目的变化,是遗传多态性与表观多样性的重要来源。检测和分析这些结构变异对于理解物种间的进化过程以及人群中复杂疾病的发生过程具有重要意义,尤其对于遗传物质发生改变的癌症而言。新一代测序技术中双末端测序方法的出现和广泛应用,使得在基因组水平检测癌症中存在的结构变异变得更加灵敏和精确。由于基因组中某些特定区域存在重复片段和实验过程中对测序数据质量产生影响,使得很多方法不能精确的检测出缺失变异。我们使用R语言开发了基于双末端测序数据中插入片段长度分布检测缺失变异的方法,该方法与目前广泛应用的其它方法相比,对同一模拟数据有更好的灵敏度和准确性。在肝癌病例的基因组测序数据中,运用此方法我们检测到60个肝癌特异的缺失变异,并且部分得到实验验证,其中有些缺失变异位于肿瘤抑制基因上,如APC, MCC等,同时也有一个缺失变异的两个断点位于基因C5orf51和CPEB4上,致使形成C5orf51-CPEB4融合基因。相对于癌症基因组而言,转录组具有时间和空间的特异性,能实时的、定量的反映某一特定生理状况的生物学特征,并可从体细胞突变、等位基因特异性表达、融合基因、基因差异表达、可变剪切和信号通路调控等方面进行分析。高通量的RNA-Sequencing技术革新了转录组的研究,它更关注于分析转录区发生的各种改变。我们运用RNA-Sequencing对九对肺癌肿瘤组织和相应的癌旁组织进行转录组测序,并进行上述几个方面的分析,找到与肺癌形成和发展相关的单核苷酸突变、差异表达基因以及功能上发生重要改变的融合基因等,如TP53, EGRF,非小细胞肺癌通路等。此外,我们还对九对肺癌样品进行聚类分析,找到一些共同的改变,如SDF4在三个样品的同一位点出现。
其他文献
通过对雷公藤野生种质资源的收集、繁殖、保存,已在福建省大田县桃源国有林场建成种质资源圃0.5hm2,共收集9个省(区)的33个种源。本文阐述了雷公藤种质资源圃营建的步骤、方法,分析
目的:探讨二氢叶酸还原酶(DHFR)基因rs11742688位点单核苷酸多态性与中国东北部人群的非综合征唇腭裂(NSCL/P)的相关性。方法:采用聚合酶链-限制性片段长度多态性方法检测东
大家可能只知道绍兴的霉干菜,其实绍兴除了霉干菜以外,还有另外一种常见的干菜,那就是笋干菜.每当油菜花开风筝飘扬的时候,家乡的空气中总是夹杂着淡淡的、咸咸的清香--那就
研究了春播和麦套2种种植模式下不同密度单粒精播对花生农艺性状和产量的影响。结果表明,精播密度对春播花生花育20号和麦田套种花生花育22号的主茎高、侧枝长均随着密度的增
社区获得性肺炎(CAP),是指在医院外罹患的感染性肺实质(含肺泡壁)的炎症,包括具有明确潜伏期的病原体在医院外发生的或在入院后潜伏期内发病的肺炎[1].