社会网络结构演化与挖掘相关问题研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:hether_yan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年来,伴随全民参与的Web2.0技术的蓬勃发展,虚拟的Web社会网络已经成为人们日常生活的一部分。Web技术的发展和大规模社会网络数据集的可获取性,为社会学和计算机科学的研究和发展提供了前所未有的机遇。   当前,计算机科学研究者在大规模Web社会网络计算领域开展了深入的相关研究:社会网络演化原理是社会网络计算的理论基础;网络结构模式挖掘可以指导大规模网络的采样,评价生成器的优劣,指导应用系统的构建;而社会网络生成器所生成的模拟网络可以辅助网络采样和算法仿真,以便对真实网络的发展情况进行预测;这些社会网络计算的理论和方法还被应用到实际生活中,构造有价值的社会网络应用,开创了新的信息服务模式并改变了人们获取和交流信息的生活方式。   本文从社会网络演化原理探索、网络模式挖掘、生成器模型构建和社会网络应用等四个方面,对大规模社会网络计算进行了研究。首先,从理论层面研究社会网络的发展原理、结构模式和生成器模型。探索了社会网络演化原理,挖掘了动态带权网络结构模式。在提出的演化原理基础上,研究了社会网络生成器。并以挖掘出的结构模式作为评价生成器效果的标准。其次,综合原理和模型,从应用的层面对社会网络计算进行了研究。研究了社会网络计算的理论和方法在在数字图书馆领域和社区挖掘领域的应用。相比于之前的研究,本文的创新之处体现在以下的五个方面:   (1)在社会网络演化原理探索方面,综合社会学研究成果与实际生活经历,提出了基于“团叠加”行为的社会网络演化原理。该原理解释了社会链接形成的机制,阐述了社会网络结构演化的形式。   (2)在社会网络结构模式挖掘方面,基于本文提出的社会网络“团叠加”演化原理,使用MapReduce编程模式,对多个真实世界大规模动态无向带权网络进行了测量。除了确认这些真实网络具备典型的社会网络结构模式之外,如幂律度分布、短的直径等,还发现了“恒定的权值幂律分布”、“恒定的结点强度幂律分布”、“恒定的权值增量模式”和“恒定的权值增量期望模式”等新的结构模式。   (3)在社会网络生成器构建方面,基于本文提出的社会网络“团叠加”演化原理,构造了一个社会网络“团叠加”生成器。并提出了一个高效的团搜索算法:K Edge Weighting Local Search(KEWLS),解决了在大规模网络中,快速搜索团的难题。理论分析和实验验证都证明了该生成器是一个现实可用的社会网络生成器。   (4)在社会网络计算的理论和方法在数字图书馆研究中的应用方面,结合本文研究的社会网络发展原理与模型,对北京大学图书馆“图书借阅网络”和“共同借阅网络”进行了分析和挖掘,详细分析了共同借阅网络的静态和动态结构模式,通过向两类网络添加属性,挖掘出了影响用户借阅行为的因素、北大影响力广泛的学科和学科依赖关系等新知识。本工作获得图书馆界专家的关注,他们认为本工作“在图书馆用户行为研究上,提供了新视角,提出了新方法,具有一定的现实意义”。   (5)在社会网络计算的理论和方法在社区挖掘研究中的应用方面,结合本文研究的社会网络发展原理与模型,提出了综合社会行动者兴趣和社会网络拓扑结构的社区发现方法。对于一个包含了社会行动者兴趣信息的社会网络数据集,首先对行动者个人兴趣进行聚类,得到基于兴趣的行动者社区。然后使用行动者社会网络拓扑结构信息,对兴趣社区进行扩展,使之更符合社区形成和发展的规律,从而达到更好的社区发现效果。
其他文献
在现代印刷行业中,预涂感光版(Presensitized Plate,PS版)作为最主要的胶印印刷版正发挥着越来越重要的作用。其品质的优劣在很大程度上决定着印刷产品质量的好坏。而PS版面
基于图像的三维重建技术,即利用拍摄的多幅图像来重建物体或场景的三维模型,相比较利用激光扫描设备获取点云数据进行模型重建的方法,该方法对摄像机设备没有较高的要求,并且受环
随着信息传播的重要新媒介网络的产生,BBS已经成为了传播最快的公共平台之一。在这个复杂的网络环境中,社会中各种现象、问题和观点交错其中,不但存在着正面的信息,也潜存着
动画作品在当今社会中已经是随处可见,同时越来越多的人想要通过动画来表达观点或想法,人们对于动画制作的需求日益增长,不仅仅是专业的动画制作人,也包括很多非专业动画制作
软件开发环境由软件开发工具和工具集成机制构成,为软件的开发、维护及管理提供统一的支持。随着软件技术的发展,软件开发环境面临着如下问题:不能重用同领域内的可复用的知
中文信息处理技术在日常生活中有十分重要的地位,但其中的基于语义层面上的深层次相似度计算的进展却比较缓慢,目前关于汉语相似度计算的方法或多或少的存在不足,本文基于语
在深空探测中,寻找地外生命始终是一个备受关注的话题。随着科学的发展和深空探测的进一步深入,地外生命存在的问题正在被越来越多的人们所关注。深空生命探索对于生命起源和
生物特征识别技术依靠人体固有的特征进行身份验证,克服了传统信息安全技术的一些缺点,提供了一种更加便捷、安全、稳定的身份识别方法。随着信息技术的发展,生物特征识别技术逐
目前用户数量和网络流量出现了爆发性的增长,同时Web应用和内容从静态向动态进行转变,互联网应用面临大规模用户和动态数据内容的挑战,Web系统扩展成为关键性问题,而数据的管
平台即服务(Platform as a Service,PaaS)是一种重要的云计算服务,它提供一个可伸缩的Web应用运行环境,不仅屏蔽了底层云设施的复杂性和异构性,更为上层应用提供弹性资源供给