基于全相位数字信号处理的基因识别算法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:kwzheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA序列是遗传物质的载体,它由四种碱基按照一定顺序组合而成。在一整段DNA序列中,只有其中一部分能够被编码成蛋白质,称为基因的外显子。而不能被编码成蛋白质的序列称为内含子。基因识别算法的目的是从未知的DNA序列中检测出有效的外显子片段。本文通过信号处理的方法检测未知基因中的编码区的位置。对基因信号做数字信号处理的第一个步骤是对DNA序列做数值映射,通过数值映射将符号序列转化为相应的数值序列,然后通过信号处理方法分析其频域特性。由于基因编码区的频谱具有三周期性,这种性质通常是由编码区密码子的偏性造成的。故可以由此特征来识别基因的外显子与内含子。针对DNA序列的数值映射问题,本文分析并研究了DNA序列的几种常用的数值映射。在三种最常用的且物理意义较明确的数值映射下,推导了DNA序列功率谱与信噪比的快速算法。讨论了三者之间的相互关系,并给出了矩阵形式的闭式表达式。针对基因识别问题,传统的谱分析方法对数据进行截断时会造成频谱泄露,影响基因识别的准确度。为了减少频谱泄露,抑制背景噪声,本文将全相位数字信号处理技术应用到基因识别算法中。此项技术通过对原始数据进行全相位数据预处理,保持数据截断后首尾波形的连续,因而极大程度上减少了截断效应。本文针对基因识别算法设计相应的全相位FFT谱分析结构,以此来提取出基因内部的三周期信号,达到对基因外显子准确预测的目的。同时将多采样率信号处理模型与谱分析结构相结合,在减少计算量的同时可实现流水线操作。为了进一步提取DNA序列中的三周期信号,提高基因识别的准确率。本文将全相位FIR模型与基因识别算法相结合,设计了适合于基因预测的全相位窄带滤波器。由于全相位FIR滤波器具有严格的线性相位,并且具有相位不变性,则又将相位旋转算法与全相位FIR滤波相结合,可以得到更为准确的预测结果。最后一节中引入定量的评价指标来对各种不同基因识别算法的效果做出评价,实验结果证明了该算法在核苷酸水平上有较高的预测准确性。
其他文献
雷达中频数字接收机采用数字信号处理算法,使用易于实现算法的CPLD、DSP 芯片或高性能的单片机微控制器,体积小,重量轻,造价低,结构简单,易模块化,系统配置更新快,维护升级方
近几年来,随着人们对信息传输数据越来越高的要求,需要更快、更可靠和更灵活的通信系统,正交频分复用(OFDM)这种多载波调制移动通信系统受到广泛关注。OFDM在频率选择性衰落信道
论文主要对网络流量及性能特征的有效测量方面进行了深入研究,并以研究测量技术与提出算法为目的,在高速网络测量及基础架构、网络流量特征抽样测量、网络性能特征抽样测量和网