二部网络与三部网络的模块识别模型与算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:fujinfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络科学在人们的生活中起着越来越重要的作用,模块识别问题已经成为网络科学研究领域最热门的研究课题之一。模块识别具有广泛的应用,如对生物分子网络、电子商务网络、社交网络的拓扑结构研究等。很多算法如最小分割法、层次聚类法、矩阵分解法、统计推断法等等,已经应用到各种真实网络数据上并取得了很好的效果。二部网络在现实生活中同样具有重要的应用价值。例如对客户和商品关系网络可用于产品推荐,对基因和药物作用关系网进行分析可用于药物的生产研究。文献中已经存在一些二部网络模块识别方法,如Barb er提出的基于谱分解的Brim方法,以及由此衍生出的一系列二部网络模块划分方法LPBrim,AdaptiveBrim等;Lehmann等将网络团的模块划分方法扩展到二部网络的方法;一类基于标签传播算法也被推广到二部网络模块识别中问题。然而这些方法大多数依赖于网络中每个节点至少属于一个模块的假设,基于这种假设的算法在实际问题的应用中往往具有局限性。值得一提的是,三部网络乃至多部网络的研究在实际生活中同样有着广泛的应用价值,如对收件人、发件人、邮件和关键词之间的关系网络进行模块挖掘,可以帮助分析社交活动,甚至用于国防安全等领域。然而三部网络的模块识别算法相对一般网络和二部网络更加稀少。为了突破这些局限和困难,推进二部网络和三部网络模块识别方法的模型与算法研究,我们展开以下三个方面的工作。  首先,本文定义一种针对二部网络局部模块识别的评价指标,并针对这种评价指标提出两种不同的优化策略最大化该指标。第一个是基于贪婪策略的局部模块识别算法LocalSEA,该算法能够快速准确的识别出具有最强特征的局部模块。第二个是基于遗传策略的模块识别算法LocalGA,该算法能够在不依赖于初值选取的条件下得到较全局的最优解。将两种算法在模拟数据和真实数据上分别进行实验,并与其他方法相比较。实验结果表明LocalSEA能够快速准确的识别出二部网络中的局部模块,LocalGA则能够稳定准确的识别出二部网络种中具有较全局最优特征的模块,两种算法表现出很好的鲁棒性和特异性。  其次,将局部模块识别问题延伸到三部网络中,建立了三部网络模块评价指标,提出了基于马尔科夫随机游走思想的三部网络局部模块识别算法LocalMCL。为了提高随机游走的收敛速度,我们还添加了膨胀和扩展过程,使算法能够快速收敛。在四组模拟实验中测试该方法,分析了各种参数情况下的局部模块识别结果,并给出了选择参数的建议。该方法在各种规模和参数的数据下都得到较为准确的结果。接着,在三组真实数据上进行实验,分析各种参数下识别的模块,得到的结果解释性较强。  最后,本文针对二部网络模块结构识别软件缺乏的困境,应用Java与C++、Matlab混合编程技术和基于JSP的网站开发技术,成功开发二部网络在线数据分析平台BMTK。该平台整合了由本文提出的LocalSEA所衍生的LocalBM算法以及其他六种存在的二部网络模块识别方法AdaptiveBrim、BCFinder、BiLPA、BiSBM、LeadingEigenvector和LPBrim,让使用者通过网站上传二部网络数据并选择相应算法,就可轻松实现二部网络的在线数据分析、模块识别、结果可视化和下载等功能。BMTK还提供了不同方法之间的结果比较和多种方法相结合的结果一致性分析,推进了二部网络模块识别方法的应用和跨平台方法整合,使二部网络模块识别的实现变的更为灵活和便捷;动态交互的可视化功能加强了使用者对模块识别结果的理解和分析。
其他文献
常规的油气动态预测方法适应的开发阶段和范围不同,在应用过程中各有其局限性;传统的确定性优化方法其本质决定了优化结果的局部优化特点,而遗传算法除了具有强的鲁棒性和并行性
该文证明了集上部份变换半群的幂等元分离同态像为弱逆半群,给出了有限集上部份变换半群中的幂等元数几个计数公式.该文还刻画了弱逆半群上最大幂等元分离同余和最小群同余,
本文分为三章。在第一章中,我们考虑调和分析的一个基本问题:分数阶曲面上测度Fourier变换的有界性,亦即连续型限制定理。围绕着这个问题,我们还将讨论Strichartz估计,它的线性和
李大钊是中国共产主义运动的先驱,中国最早的马克思主义传播者,中国共产党的主要创始人之一。李大钊,字守常,1889年10月29日出生于渤海之滨的河北省乐亭县胡家坨乡大黑坨村。
运用上、下解方法和不动点定理讨论有序Banach空间中几类脉冲微分方程(IDE)解的存在性,同时利用单调迭代技巧建立极解存在性定理,给出极解的迭代过程.针对存在无限脉冲现象的
算子理论产生于二十世纪初,是泛函分析的一个重要部分。算子理论主要以各种函数空间上算子的性质作为研究对象,以Hilbert空间上的线性算子的有界性、紧性、Fredholm性质、谱性
本文研究了两类从e1(Z)空间到L1(R)空间的插值算子的范数(有时叫Lebesgue常数)的强渐近估计问题,内容包括L基样条插值、高斯基函数插值的Lebesgue常数的强渐近估计问题,并且分
针对光学和电磁学中某些散射和反散射问题,我们在该文中主要做了以下几项工作:首先,对一类特殊的散射问题(具有特殊结构的衍射光栅问题)进行了理论分析,并且研究了求解此问题