基于SDTW算法的DNA序列相似性分析

来源 :计算机与应用化学 | 被引量 : 0次 | 上传用户:barbaraxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA序列相似性分析是生物信息学中最主要的内容之一,它的研究对于发现物种间的进化关系、判断血缘关系、治疗疾病等有着至关重要的作用。利用图形表示方式来分析 DNA 序列相似性时,局部差异是反映相似性的重要内容,但某些局部差异累积会导致本来十分相似的DNA序列在全局上呈现出较大的差异,从而导致误判。根据这一思想,本文提出基于SDTW算法的 DNA 序列相似性分析,该算法通过合理的分段既保持了局部差异的作用又在一定程度上控制了局部差异对全局差异的影响范围。文中以9个物种β-球蛋白第一个外显子的编码序列作为分析对象,将该算法与已有算法的分析结果进行比较。结果表明本文提出的算法相似性分析更加准确,分析结果的敏感性较高,有助于提高进化距离较近的分析对象间的区别度,可将其进一步应用于生物序列的信息分析。
其他文献
用基于密度泛函理论的第一性原理研究软质聚氨酯分子中2,6-二异氰酸甲苯酯基对异辛烷的吸附。电性分析得知偶极矩-偶极矩相互作用力较弱,但色散力较强,吸附剂对吸附质的诱导
根据Gibbs自由能最小化原理,利用ASPEN PLUS对化学链空气分离制氧系统进行了热力学研究。选用Mn2O3/Mn3O4为氧载体,讨论了新鲜空气进料量和还原温度对水蒸气用量与O2产量的影响
以并3-6苯环为氢化石墨烯片层模型,采用量子化学密度泛函理论方法(DFT)在B3LYP/6-31G(d,p)水平上进行了几何结构全优化,讨论了分子结构、能量、前线分子轨道等性质的变化规律
针对化工过程的非线性以及过程的动态特征,本文开发出了一种基于最小信息熵损的核局部保留算法(MEL-KLPP)。算法优点:①能够有效提取过程中的信息,建立准确的统计模型②在降维过
在介观假设的基础上,用GCMC方法,基于UFF力场,研究了金属有机骨架材料(IRMOF-9)在不同官能团(-NO_2,-NH_2)和不同金属离子(铝、钙、镁、铜、铁、钴、镍)修饰后对甲烷气体吸附
针对化工厂配电网中的短路故障和变压器投切引起的电压暂降信号的非平稳性以及电动机启动引起的电压暂降信号的特殊性,提出1种基于EMD模态能量和SVM的电压暂降源识别方法。首
利用粗糙集(RS)理论研究了嘧啶酮类HIV整合酶抑制剂(INs)的构效关系(SAR)。首先用量子化学方法得到HIV整合酶抑制剂的量化参数,由量化参数和活性数据构成了粗糙集的信息表;然
提出一种利用回声状态网络(echo state network,ESN)建立复杂分布参数系统模型的灰箱建模方法。此建模方法可以充分利用已知机理模型的结构信息和回声状态网络的逼近能力,可
针对基于传统的多向主元分析(Multiway Principal Component Analysis,MPCA)方法用于间歇过程在线监控时需要对新批次未反应完的数据进行预估,从而易导致误诊断,且统计量控制限的确定是以主元得分呈正态分布为假设前提的缺陷,结合Fisher判别分析(Fisher Discriminant Analysis,FDA)在数据分类及非参数统计方法核密度估计(Kernel D
利用热力学基础数据和相关软件对Co-Mo-K催化剂上COS、HCN加氢和水解反应进行了热力学计算。在热力学上,COS、HCN加氢和水解反应在耐硫变换条件下均为自发过程。计算结果表明