基于数据场的Web社区发现研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:jettey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web的高速发展,如何从非结构化的Web网络中发现和利用有用信息变得越来越具有挑战性。类似于人类社区,在Web发展的过程中,也涌现出大量的Web社区,这些社区是人类社区活动在互联网上的体现。对Web社区的深入研究有助于人们更加深入地了解Web中知识信息及其组织结构的发展状况。   本文首先分析了Web社区发现技术的相关研究进展,重点对链接分析技术、基于二分图的社区发现技术和基于流量的社区发现技术进行了综述。其次在充分考虑Web网络结构特点的前提下,将数据场理论与Web社区发现相结合,提出了基于数据场的Web社区发现算法,该算法将网络中的每个节点对其周边节点的影响力映射成数据场,通过社区内场势的变化规律发现社区结构。最后,将基于数据场的web社区发现算法应用于网络舆情监控系统,用实际网页数据验证了该算法的有效性。此外,本文还对Web社区结构特征作了进一步的研究,结合节点场势和聚集系数等因素,分析了Web社区的分层结构,指出在Web社区中,节点成员的重要性是不一致的,可以分为核心成员、普通成员和边缘成员等三类,Web社区也可以分为高原社区、山岭社区和山峰社区等。
其他文献
因特网环境下的企业产品销售与传统方式有很大差异,受因特网和信息技术手段以及电子口碑的影响,消费者网上购物决策及其购买行为已经发生改变,主要因为:(1)网上的产品信息,既
南方日报经过去年一年的大跃进,取得了很大的成绩和积累了不少的经验。为了肯定成绩,总结经验,继续鼓足干劲,争取今年更大、更好、更全面的跃进,我们曾于最近进行了为期两个
近年来,我国住房保障工作不断推进,相应的资金缺口也越来越大,单一依靠政府投入已经远远不能满足要求。因此,通过PPP模式引入私人资本已经成为一种必然趋势。另外,目前国家主管部
建筑业是伤亡率仅次于煤矿业的高危行业,建筑项目施工现场经常发生安全事故,给社会经济、人民生活和自然环境产生了重大的影响。在建筑工程的所有施工环节中,高空作业是最具
1988年在不能浇水的旱薄地上,进行了棉花免中耕试验,结果亩产皮棉103公斤,比对照亩增皮棉31.5公斤。棉花免中耕高产的主要原因是: 1、免中耕棉田虽然地表干旱,但下层 In 19
我国培养水平很高的新闻工作者的工作,基本上委托给国立大学.新闻工作这一种职业要求具备各方面的知识,而这些知识在大学里最容易获得,因为大学里广泛地设有人文科学和自然
萤火虫群优化算法来自于大自然中萤火虫群的觅食行为,大自然中的萤火虫会带有一定数量的荧光素,并且可以通过个体所发光亮的强度向周围其他萤火虫传递信息。一般,如果萤火虫
最近,有的报纸编辑部着重地提出:必须注意提高报纸宣传的思想性.要求全体编辑和采访人员在报道和阐述各方面的问题,首先是重要问题的时候,要从理论上加以说明.就是说,不管讨
知识溢出对技术进步和社会发展是一把双刃剑,而知识产权适度保护是对知识溢出取利避害的关键.但是实地调查表明,长三角地区传统制造业中的创新成果处于知识产权弱保护状态.这
本文根据我国食油消费水平及产销矛盾,提出选建商品油料生产基地,是缓解食油紧张状况的有效途径。通过对全国乡县三年调查数据的分析,根据集中连片,择优选建的原则,在全国范