论文部分内容阅读
MicroRNA是一类大约19~25个核苷酸的内源性单链非编码小分子RNA,通过特异性识别并结合靶mRNA3’非翻译区(3’-untranslated region,3’UTR),降解靶mRNA分子或抑制其翻译,是一类重要的调控因子。MicroRNA在细胞发育、增殖、分化、凋亡、代谢等多种与肿瘤形成与发展密切相关的生物学过程中发挥重要调控作用,是肿瘤形成与发展的重要调控因子。因此,识别与特定癌型密切相关的microRNA成为肿瘤学研究与应用中迫切需要解决的问题。目前广泛采用寡核苷酸microRNA微阵列技术、反义寡核苷酸microRNA微球流式细胞仪及qRT-PCR技术来检测肿瘤细胞中特异表达的microRNA。然而细胞中成体microRNA的序列较短、序列相似性较高,同时大量microRNA在细胞中特异低丰度表达。这些因素降低了上述检测技术的敏感度和特异度,检测结果存在较高假阳性和假阴性。 随着组学技术的发展,大量组学数据的产生使得计算系统生物学方法被广泛用来识别与特定疾病密切相关的分子标记。研究人员基于组学数据和方法优选并识别疾病相关基因、蛋白以及生物学通路等,取得了巨大成功。然而使用计算生物学方法优选人类肿瘤microRNA还面临挑战。首先,目前的microRNA靶基因数据主要来自于预测算法,存在较高假阳性,极大地限制了识别方法的性能。其次,目前的计算方法主要采用单来源组学数据分析microRNA与肿瘤之间联系,数据的不完备性和偏性限制了识别方法的性能。 本研究首先在功能组学背景下系统分析了microRNA靶基因间的功能关系,发现同一个microRNA的靶基因显著倾向于注释相同或相近的生物学过程,同时在蛋白网络上互作更加紧密。基于此发现,开发了基于多组学数据的microRNA靶基因筛选方法,用以降低目前常用靶基因数据库的假阳性率。识别性能分析显示该优选方法能够以较高精度和敏感度识别经实验证实的microRNA靶向关系。该方法的建立为获得可信microRNA靶基因集以及准确识别microRNA调控的生物学功能提供了基础。接着,本研究分别基于Gene Ontology注释体系和蛋白互作网络开发了两种方法用于定量分析microRNA靶基因集与癌风险因子之间的功能关联。最后,本研究以大肠癌为例运用上述方法对677个mrcroRNA进行优选,构建了microRNA优选列表,性能分析显示本研究建立的基于多组学数据的人类癌microRNA优选方法具有较高识别效能,与直接整合靶基因库、直接使用经实验证实靶以及与前期开发的仅基于GO的方法相比,识别性能有显著提升。本课题的研究成果,对系统识别恶性肿瘤microRNA有重要意义,将对进一步揭示恶性肿瘤的分子调控机制和临床诊断、治疗及预后研究具有重要作用。