论文部分内容阅读
研究背景和目的结直肠癌(colorectal cancer,CRC)是威胁人类健康的最常见恶性肿瘤之一。2018年,全球结直肠癌发病例数约为180万,结直肠癌死亡例数约为86万。我国是上世纪的结直肠癌低发国家之一。然而,近年来随着我国社会经济的高速发展,传统的饮食结构和生活方式被打破,居民的肿瘤发生率和肿瘤谱已发生明显变化。结直肠癌发病率呈明显上升趋势,已成为威胁我国居民健康的重要公共卫生问题。结直肠癌的发生发展是环境因素、遗传因素和表观遗传因素共同参与下的多因素、多阶段、多步骤过程,具有较长的癌前病变阶段。现阶段对于结直肠癌的遗传变异因素研究已相对成熟,而表观遗传学研究则方兴未艾。DNA甲基化是表观遗传学中最重要的调控机制之一,可通过调控编码基因转录水平,参与胚胎发育、印记失活、细胞分化以及衰老等多种重要生物学过程。通过以往的候选基因分析以及表观基因组关联研究(epigenome-wide association study,EWAS),已识别出不少与结直肠癌发生相关的异常甲基化基因,并发现异常甲基化改变在癌前病变阶段已经存在。然而目前很少有研究系统性地定义肠上皮细胞恶性转化过程中异常甲基化事件的变化。材料与方法本研究采用了三阶段研究设计:在全基因组初筛阶段,纳入12例结直肠癌患者的癌组织和癌旁正常组织,采用Illumina Methylation EPIC Bead Chip进行全基因组扫描,系统研究基因组甲基化位点分布特征,构建结直肠癌甲基化谱。进一步整合肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)数据库中甲基化芯片数据和转录组表达数据,初步识别与结直肠癌潜在相关的异常甲基化基因。根据筛选结果,第一阶段验证纳入46例结直肠癌患者的癌组织和癌旁正常组织,采用焦磷酸测序技术对候选基因的甲基化水平进行检测,分析甲基化芯片和焦磷酸测序检测结果的一致性,筛选结直肠癌相关异常甲基化基因。随后在第二阶段验证中,纳入13例增生性息肉、129例结直肠腺瘤和256例结直肠癌患者的病变组织和非病变组织,采用焦磷酸测序技术检测结直肠癌相关基因甲基化水平,采用线性混合效应模型评价目标基因甲基化水平在结直肠癌发生进展过程中的变化。结果在全基因组初筛阶段,共识别异常甲基化Cp G位点174,006个,其中异常高甲基化位点22,232个,异常低甲基化位点151,774个。根据基因相对位置和Cp G岛相对位置对甲基化位点注释后发现,异常高甲基化位点多位于基因启动子和Cp G岛重叠区域,而异常低甲基化位点多位于远离基因序列的非功能区。通过整合TCGA数据集甲基化芯片数据和转录组表达数据,初步识别了与基因表达相关的异常甲基化基因316个。其中异常高甲基化基因265个,异常低甲基化基因51个。从基因集中筛选出甲基化变动最显著的基因作为潜在结直肠癌相关甲基化基因进入后续的验证性研究。最终确定的甲基化基因为MPPED2、IKZF1、RSPO3、GALR1、COL23A1、EPHA6、INHBA和HKDC1。第一阶段验证结果显示,MPPED2、IKZF1、RSPO3、GALR1、COL23A1和EPHA6在结直肠癌组织中甲基化水平显著高于配对的癌旁组织;INHBA和HKDC1在结直肠癌组织中甲基化水平显著低于配对的癌旁组织,与甲基化芯片结果一致。其中,MPPED2、GALR1、INHBA和HKDC1四个基因在ROC曲线分析中,判别组织癌变的能力良好(灵敏度和特异度均大于0.80),故纳入到第二阶段验证性研究中。第二阶段验证结果显示,MPPED2在增生性息肉、结直肠腺瘤和结直肠癌病变组织中的甲基化水平均显著高于配对的病变旁组织。GALR1甲基化水平在增生性息肉病变组织中的甲基化水平与病变旁组织无显著差异,但在结直肠腺瘤和结直肠癌病变组织中的甲基化水平显著高于配对的病变旁组织。INHBA和HKDC1在增生性息肉、结直肠腺瘤和结直肠癌病变组织中甲基化水平均显著低于配对的病变旁组织。此外,GALR1的甲基化水平与病变部位有关,结肠癌显著高于直肠癌。应用线性混合效应模型建模分析发现,结直肠组织从正常到癌变过程中,MPPED2和GALR1的甲基化水平持续增加,在结直肠腺瘤和结直肠癌阶段的甲基化增幅统计学意义显著;INHBA和HKDC1甲基化水平持续降低。其中,INHBA自增生性息肉阶段起甲基化变动值存在统计学差异。而HKDC1自癌旁正常组织阶段起,基因的甲基化水平已显著低于正常大肠切缘黏膜组织。结论本研究采用全基因组甲基化芯片分析和公共数据库数据分析相结合的方式,筛选结直肠癌相关甲基化基因,并基于数学模型描述了异常甲基化基因在结直肠癌发生进展过程中的变化,主要结论如下:(1)结直肠癌组织和癌旁正常组织之间,基因组DNA甲基化模式呈现显著性差异。其中,结直肠癌相关异常高甲基化改变多位于基因启动子和Cp G岛重叠区域,而异常低甲基化改变多位于远离基因序列的非功能区。(2)MPPED2、IKZF1、RSPO3、GALR1、COL23A1和EPHA6在结直肠癌组织中甲基化水平显著升高,INHBA和HKDC1在结直肠癌组织中甲基化水平显著降低,上述基因的甲基化水平可能与结直肠癌发生存在关联。GALR1的甲基化水平与病变部位有关,结肠癌显著高于直肠癌。(3)MPPED2和GALR1的甲基化水平在结直肠组织从正常到增生性息肉到腺瘤到癌变过程中不断累加。INHBA和HKDC1的甲基化水平在结直肠组织从正常到增生性息肉到腺瘤到癌变过程中不断降低。异常低甲基化基因的甲基化改变比异常高甲基化基因的甲基化改变出现的早。