论文部分内容阅读
结直肠癌(colorectal cancer,CRC)是全球高发恶性消化道肿瘤之一。虽然近年来结直肠癌的诊断和治疗手段已有了很大的改善,但其死亡率仍居高不下,且分子发病机制也并未清晰明了。因此,寻找结直肠癌诊断及对结直肠癌发生发展精准干预的靶点始终是其防治领域的研究热点。于是,本研究基于生物信息技术,高通量筛查与结直肠癌发病、病变程度和预后相关的潜在生物标记物,并试图发现结直肠癌潜在的新致病基因和用于诊断治疗的新生物标记物,以及揭示它们潜在的生理与病理功能。我们首先从基因表达数据库(Gene Expression Omnibus,GEO)中筛选并下载符合标准的芯片数据,共获得161例结直肠癌组织和136例正常结直肠组织的基因芯片数据。然后,通过ComBat方法消除不同来源芯片数据之间存在的批次效应,并使用‘limma’R软件包筛选差异表达基因,结果共发现了1776个差异表达基因,包括742个上调基因和1024个下调基因。并对结直肠癌组织的基因芯片数据运用加权基因共表达网络分析,将差异表达基因聚类为7个模块。随后,依据模块的保守性分析,最后选择黑色和粉色模块为研究的对象,对它们进行基因富集分析。分析结果显示,除Ras、PI3K-Akt和MPKA等常见的与癌症相关的信号通路外,细胞因子-细胞因子受体相互作用和趋化因子信号通路很可能参与了结直肠癌的发生与病变进程。此外,利用癌症和肿瘤基因图谱数据库(The Cancer Genome Atlas,TCGA)对黑色和粉色模块中的差异表达一致的基因进行生存分析,我们发现FDCSP、FAM46C、SLAMF7、MS4A1、NEDD9、PLAGL2、CACNA1D和RUBCNL 8个基因的表达与患者的5年生存期之间存在着显著的相关性。但PLAGL2、CACNA1D和RUBCNL这3个基因的患者5年生存期之间存在交点,说明它们随患者的影响是非单因素的。进一步对FDCSP、FAM46C、SLAMF7、MS4A1和NEDD9 5个基因使用多变量COX风险比例回归分析时,发现MS4A1和NEDD9组成的集合可能作为结直肠癌预后诊断的生物标记物,且MS4A1在该集合中对患者的生存有着独立的影响。为验证CACNA1D、RUBCNL和NEDD9基因在结直肠癌中的蛋白表达情况及病变中的潜在作用,我们运用了免疫组织化学法检测了它们在结直肠癌组织芯片腺上皮在不同病期的表达水平和分布。结果显示,CACNA1D、RUBCNLD和NEDD9蛋白质在结直肠癌变组织中均呈高表达。另外,还发现CACNA1D和NEDD9蛋白质的表达在结直肠癌病灶中的表达与TNM分期,临床分期和病理分级显著相关。但是,NEDD9蛋白质在结直肠癌组织细胞中虽呈高表达(与先前报道的有关免疫组织化学染色结果相似),但与从GEO数据库和TCGA数据库得到的NEDD9 mRNA表达趋势相反(癌组织与癌旁正常组织相比,其表达是减少的)。为此,我们会扩大结直肠癌组织样本量对NEDD9的mRNA表达再进行可靠性比较、验证和分析。综上所述,本研究通过生物信息学分析,发现FDCSP、FAM46C、SLAMF7、MS4A1、NEDD9、PLAGL2、CACNA1D和RUBCNL 8个基因的表达与患者的5年生存率存有一定的关联,特别是MS4A1和NEDD9这2个基因集合可作为提示结直肠癌预后的新生物标记物。此外,通过芯片数据和测序数据的mRNA表达分析发现CACNA1D、RUBCNL和NEDD9在结直肠癌中的表达是有着潜在的生理与病理意义的,并通过免疫组织化学染色实验验证。尽管其中NEDD9的mRNA表达与免疫组织化学法得到的蛋白质表达趋势不同,但这三个基因仍值得我们对它们在结直肠癌中的调控机制进行深入探索。