论文部分内容阅读
随着人类基因组计划的实施,分子生物学家提供了大量生物分子的原始数据,需要利用现代计算技术对这些数据进行收集、整理、管理以便于检索使用。同时还需要对数据进行比对、分析,建立计算模型,进行仿真、预测与验证。生物信息学的中心任务就是从浩如烟海的序列数据中提取理性知识,从中确定与某一特定生命现象相关的基因及其功能,这已成为后基因组时代国际上争夺的焦点,其中基因表达数据分析又是生物信息学研究的重点和热点。 在本论文中,首先介绍了基因表达数据分析成为生物信息学研究热点的背景知识,以及有关基因表达数据分析的生物学知识,综述了基因表达数据分析的国内外研究现状,同时介绍了本选题与电气学科的关系。在此基础上,从信号处理的角度对基因表达数据进行了分析。 首先对基因表达数据分析中的聚类问题进行了研究。主要就基因表达数据聚类分析中存在的噪声问题,提出了采用小波变换方法进行去噪,然后再进行模糊c-均值聚类的方法,就去噪过程中小波变换实现的方法进行了探讨和比较,给出了聚类结果,并与直接模糊c-均值聚类的结果进行了比较。结果表明,对与酵母细胞周期调控有关的基因表达数据小波去噪处理后再聚类的准确度优于直接的模糊聚类,能够区分出不同的基因表达模式,并且同一类中的基因表达模式基本一致,是一种更有效的聚类方法。用于其他未知功能基因的聚类分析,将可以准确地探测聚类,为进一步分析它们的生物功能提供参考。 然后针对基因之间的延时调控关系,尝试了将信号处理中的互谱估计方法运用到基因表达数据分析中。提出了采用互谱估计方法的基因表达数据延时调控分析方案,从理论上探讨了该方法实现的可行性,并用于基因表达数据的分析,从中找到了基因之间的延时调控关系,初步构建了基因延时调控网络。 采用信号处理的方法得到的基因表达数据分析结果,可以对某些生物学上功能类别还不明确的基因提供些许有潜在意义的线索。然而,基因之间的调控关系是如此复杂,要构建出整个调控网络,彻底揭示基因间相互作用的秘密,还需要做大量的研究。