网络社区的问题路由模型及其消息系统的优化方法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:wyp345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机的普及和网络技术的发展,让人类能更便捷交流和通信。网络交互手段丰富多样,催生了许多类型的网络社区。网络社区指的是具有共同兴趣及需要的人们,利用网络通信的技术,通过网上互动而构筑的社会生活空间[Http1]。网络社区汇集了海量的用户及用户的讨论数据,尤其一些专门领域的网络社区,更是包含了这个领域内的专业知识,这为新的应用和研究提供了契机。   网络社区用户数量的持续增长和数据信息的日益丰富,带动了许多基于网络社区的应用的出现和发展,由问题路由技术支撑的问答服务就是其中之一。问题路由技术能在用户提交问题后,主动地将问题路由到合适的回答者,缩短问题被解答的时间。问题路由技术的核心,是将问题和用户进行问答匹配的问题路由模型。一方面,现有的问题路由模型,如语言模型和图分析方法等,都忽略了社区数据中包含的语义信息,没有充分利用社区数据的特性提高问题路由模型的效率;另一方面,问题路由模型在对问题的路由过程中,会带来提问者和回答者间的消息交换,在海量用户环境中,用户间的频繁交互,会给支撑问题路由技术的底层消息系统带来沉重的负载压力。由于用户间的消息交换是通过消息系统客户端实现的,消息系统客户端在消息系统各路由节点上的连接位置,会极大地影响消息交换的效率,进而影响到问题路由中用户间的交互效率。   基于此,本文旨在研究利用社交网络分析方法,对网络社区的问题路由模型及其消息系统进行优化:在应用层,问题路由模型中的用户通过讨论与交互,形成了用户问的社交网络及问题间的语义网络,本文对用户社交网络进行分析并与问题语义网络整合,来提高问题路由的准确率;在系统层,问题路由的消息系统客户端通过消息交换,也形成了客户端之间的通信关系网络,本文对客户端通信关系网络进行分析,通过优化客户端在消息系统节点上的连接位置,实现客户端的优化部署,缩短消息传递的路径长度,来提高问题路由过程中的消息传递的效率,提升消息系统性能;在客户端通信关系网络发生变化,客户端需要重新部署时,本文以部署代价为约束,通过客户端通信关系网络的迭代社区划分与聚集,达到系统性能提升与部署代价间的平衡,实现客户端的动态优化部署。   具体来讲,本文工作包括下面三个方面:   1)提出了整合语义网络与用户社交网络的问题路由模型   本文针对网络社区中数据的特性,提出了基于问题语义网络和用户社交网络整合的问题路由模型。本文先通过一个数据采集器搜集了三个网络社区的数据并分析数据的特性:然后基于分析结果,针对某些特定领域的网络社区,提出了问题的语义挖掘方法以及语义之间的语义网络构建方法;并将语义网络与用户的社交网络整合,用于问题路由。实验验证了模型的通用性,准确率和可扩展性,与现有方法相比,路由准确率能平均提高约20%[LiW10]。   2)提出了基于社交网络分析的消息系统客户端优化部署算法   本文在对问题路由模型的消息系统的客户端部署问题进行抽象的基础上,提出了基于社交网络分析的客户端优化部署算法。本文先构建消息系统客户端的通信关系网络,并对客户端通信关系网络进行分析,选取网络中权值较大的客户端点作为其他客户端的聚集中心;然后将其他客户端聚集在选取的聚集中心所在的节点或相邻节点,实现客户端的物理聚集。实验证明,相比于传统梯度负载均衡法,算法能将消息负载总量减小约20%[李09],并有效缩短了消息传递的路径长度,进而缩短了消息传递的时延。   3)提出了基于社区划分的客户端动态优化部署算法   本文考虑了当客户端关系发生变化时的客户端重部署代价,设计了客户端动态优化部署算法。本文将系统优化的性能指标定义为目标函数,将客户端的部署代价定义为条件限制约束;通过对客户端通信关系网络进行迭代的社区划分和社区聚集,实现部署代价与系统性能之间的折中平衡。实验结果显示,与现有的基于兴趣的聚集算法相比,算法在各种不同的实验设定下都能有效提高系统性能,系统消息负载平均减小约50%,消息传递时延平均减小约40%[李12]。
其他文献
近年来,随着各种富因特网应用(Rich Internet Application, RIA)技术及工具的兴起,Web应用程序中的用户界面正由传统的超文本语义型向丰富多彩的桌面型转变。本论文就是采用
在当前互联网时代,如何便捷地从海量文本数据中获取有效信息是我们面临的巨大挑战。文本信息检索的主要任务是根据用户输入的查询语句,为用户找到最相关的文档。然而,由于用户的
随着通信与IT技术相结合的ICT应用的不断发展,人们越来越意识到了系统间融合的必要性。目前移动通信和物联网在各自的领域都有着较为快速的发展,天线是这两个系统都必须的信
随着海量数据时代的来临,分布式数据处理系统己成为海量数据处理的解决方案。针对不同的应用场景,学术界和产业界推出了多个并行编程框架。通过对不同的并行编程框架研究分析
随着计算机时代的到来和信息技术的快速发展,企业信息化成为企业在竞争中发展进步的必然选择。报表是企业进行数据整理、格式化和数据展现的一种有力手段。报表可以为用户提
传统示波器的调试方法不利于伺服系统的现场测量和测试,如果个人PC机能够做为调试工具,将使伺服系统的调试更加的方便。伺服驱动器PID参数设置对系统的各项性能指标具有重要影
Android是一种以Linux为基础的操作系统,主要用于便携设备。一经推出,便凭借其免费与开源的特性迅速抢占市场。2011年8月,Android操作系统更是在全球智能手机操作系统的市场
近些年来,互联网已经从资源共享的工具转变为海量信息分发与获取的平台,人们更加关注内容是什么,而非内容在哪儿。为满足这一趋势,内容为中心的网络被提出,而缓存功能的加入
随着互联网技术的快速发展,Web服务技术无论在研究领域还是网络应用领域都备受关注,Web服务的广泛应用使得Web服务的数目也在快速的增加,功能相同或者相似的Web服务也会随之
Web搜索引擎为互联网网民获取信息提供了重要途径,商业搜索引擎每天接收数以亿计的查询请求,高效获取所需要的信息成为搜索引擎的重大挑战。本文利用搜索引擎查询日志研究搜