生物网络中概率模体发现算法的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:pathos_boy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物技术的发展,产生了大量的生物网络数据。如何从这些生物网络数据中发现一些具有生物功能的拓扑结构成为生物信息学的一个研究热点。大量实验表明,模体是这些生物网络中有生物功能的基本模块。目前模体的研究主要侧重于识别精确模体,事实上,由于目前的测量手段的不准确性或者实验方法的不完整性,这些已经得到的生物网络数据往往是有噪声的或者不完整的。另外,生命过程本身也是一个动态变化的过程,因此概率模体更能体现生命的动态变化过程和生物网络的功能意义。概率模体发现算法的主要瓶颈在于非树形子图的挖掘和在得分函数最大化的过程中得分函数值的计算。其中后者需要进行多图比对,并且需要建立在任意两个子图的两两最小错配的基础上。当要发现的概率模体规模增大的时候,计算任意两个子图的最小错配所需时间也急剧增长。   因此,论文的主要工作如下:   1.论文首先提出了一种基于划分的非树形子图搜索算法,与已有的非树形子图搜索算法相比,具有更高的时间效率。   2.论文利用子图同构是子图最小错配的特殊化,求解子图同构比求解子图的最小错配更有效率这一优势,提出先利用同构来对子图分组,属于同一个同构组的任意两个子图其最小错配为零,之后再对不同构的子图进行最小错配的求解。这样在减少了求解任意两个子图最小错配时间的同时,也缩小了之后利用智能优化算法对得分函数求解的解空间。   3.论文将一种基于模拟退火算法和遗传算法的混合算法应用于得分函数的求解过程,这与已有的只利用模拟退火算法进行求解相比,能以相对较快的收敛速度收敛到一个较优的解。   4.论文将子图抽样方法应用于概率模体的识别,进一步提高了概率模体发现的效率。   本文在大肠杆菌基因调控网络中进行了实验验证,实验结果表明上述提出的方法可以有效地提高概率模体发现的效率。
其他文献
随着互联网技术的快速发展,搜索引擎技术随之诞生。人们总是希望通过搜索引擎找到最相关、最权威的网页,而搜索引擎网页排序算法的好坏直接关系到用户能否找到这样的网页。所
面对当今社会信息系统安全需求的日益增长,已不可能单纯地靠技术手段从根本上解决信息系统的安全问题,更应该从系统工程的角度来看待信息系统的安全问题。风险评估是信息系统
随着互联网的高速发展,众多企业和个人已经把大量数据交给第三方服务器存储,如何保证私有数据的机密性和隐私成为急需解决的问题。加密技术是保护数据机密性和隐私的一种较为
社会经济的不断发展推动着人口大规模地向城市地区聚拢,导致交通越来越拥堵。交通拥堵已成为困扰交通领域的一个难题。大范围的车辆检测识别能及时的获取交通信息,改善交通安全
随着信息时代的发展,实时嵌入式系统已经不仅仅应用于工业自动化控制,而是更广泛的应用于多媒体通信、突发事件处理、环境监测、交通控制以及航空航天等领域。传统微内核结构
近年来,图数据模型广泛应用于生物信息、计算化学、语义网等领域。现有的图数据查询处理技术大多基于频繁子图,是一个过滤、验证过程,即首先通过挖掘出来的频繁子图构造索引,然后
智能规划的研究是人工智能研究领域的一个重要分支,在具体的实际应用中具有重要的意义。虽然基于模型检测的规划方法发展时间不长,但是可以用其来解决很多问题,例如求解不确
词类划分与词性标注都是自然语言处理中重要的基础性研究课题,也是后续研究如浅层句法分析、文本分类、机器翻译等的基础。该课题的研究方法主要有三种:基于规则的方法、基于
遗传算法通过模拟生物自适应选择过程和自适应进化过程,通过不断迭代逼近最优解,可以将其用于求解高度复杂的非线性最优值问题。在对复杂的单目标问题进行求解时,遗传算法表
新一代网络计算是以大规模、分散控制、动态性、自治性和松耦合为主要特征的分布式计算,传统的点对点和同步通信已不能满足动态应用环境。发布/订阅(Publish/Subscribe)是一