论文部分内容阅读
MicroRNAs(miRNAs)是一类长约22nt的非编码小RNA分子,通过介导其靶基因的转录后调控,在人类的多种生理与病理过程中发挥着举足轻重的作用。随着二代测序技术的发展,针对人类不同组织和疾病样本的小RNA测序研究广泛开展,得到了大量有意义的发现。鉴于这些研究往往只是针对单一组织或疾病的样本,为此本项目希望整合它们所累积的海量原始测序数据,对这些组织和疾病进行系统的比较研究。首先,下载原始的小RNA测序数据,进行系统的处理和整合。从NCBI公共数据资源库中大规模收集人类小RNA测序数据,经过严格的质量筛选,最终确定了410个涵盖多种疾病与组织的数据集。使用自主建立的miRNA标准分析流程,测试并选用最优参数,将原始的测序数据转化为miRNA表达量数据,最终得到2042个miRNA在410个数据集中不同组织或疾病样本的表达量,并进一步利用这些结果数据,构建人类miRNA表达数据库HMED(http://115.156.249.50/smallRNA/),为miRNA研究者提供了宝贵的数据资源。然后,利用处理得到的表达量数据,做进一步的系统分析,如疾病与组织特异性表达miRNA、差异表达miRNA,miRNA的isomiR与臂转换(arm switching)现象的分析。通过这些分析,我们得到一些有意义的发现,如发现hsa-miR-21-5p,hsa-let-7f-5p,hsa-let-7a-5p,hsa-miR-26a-5p,hsa-miR-103a-3p和hsa-miR-191-5p这6个miRNA在所有的样本中都高表达;某些样本中,某些miRNA的isomiR表达量要高于其传统的参考序列,提示该miRNA可能是通过其isomiR来发挥功能;有的miRNA,其在某些组织中5p成熟体表达量高,而在另一些组织中3p成熟体表达量高,提示该miRNA有臂转换现象。本课题通过收集整合大量miRNA表达数据,对miRNA的表达进行全面研究,并挖掘miRNA相关信息,为miRNA的进一步研究提供了重要线索和资源。