开放式搜索及数据管理服务平台的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:tu139201103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络和电子商务站点的蓬勃发展,互联网上积累了大量的非结构化数据。这些数据一方面数量巨大,另一方面数据之间的关联度很低,传统的关系型数据库在处理这种数据时,发挥不出优势,反而因为自身结构的限制,会遇到性能瓶颈。另一方面,这些站点上的用户面对繁杂的数据,需要能够对站点内的资料进行快速精准的检索,站内搜索应用成为服务入口,承担着拉升用户活跃度和吸引流量的重要任务。面对这种情况,开发人员需要一种数据库服务能打破传统的关系模型,以“模式自由”的方案进行数据存储,同时,为用户提供站内检索服务。通过对非关系型数据库和搜索引擎的工作原理的调研,本课题找到了一种方式,将二者在功能和架构上进行融合和改进,设计了“开放式搜索及数据管理系统”。既开发人员可以摆脱复杂的数据模式设计过程,提高了站点数据的存储效率;又满足了普通用户对信息建设的需求。在功能上,本系统通过使用“标签”存储的方式,找到了非关系型数据库和搜索引擎之间的结合点;在软件架构上,将数据管理系统的架构设计为分布式系统,保证了系统性能的可扩展性。另外,本系统将用户行为也纳入到数据管理系统中,改善了用户体验。本文首先简要介绍了课题研究所需要的背景知识,总结了前人的相关工作;接下来对系统的设计需求和可行性进行了调研,之后详述了其系统架构和设计原理;最后依据之前提出的方案,对其进行了具体实现,并且评估了系统的性能。
其他文献
非线性色谱模型理论是制备色谱的基础,它对用色谱分离高纯度生化产品、医药产品及精细化工产品具有重要意义.该文在前人成果的基础上,深入、详细地分析了环形模拟移动床系统
分布式移动性管理(DMM)解决了集中式移动性管理的单点故障和三角路由等问题,近年来受到了越来越多的关注。虽然目前DMM的研究已经取得了一定的成果,但还存在着诸多问题。如现
该文以Object-Z规格说明作为推导测试用例的依据,探讨了一种基于规格说明的类测试的方法和技术.基中包括:从被测类(Class Under Test,CUT)的Object-Z规格说明得到测试用例;分
该文在研究及分析了Internet/Intranet环境下的WWW各种技术的基础上,提出了基于Browser/Swrver结构的面向生产管理实时数据的信息发布系统的模型以及实现模型的两种技术方法,
随着计算机技术地不断发展,互联网服务和嵌入式设备也越来越普及,许多非智能设备都被赋予了新的定义,如智能手表、智能机顶盒、智能家电等。它们都拥有独立的操作系统、可以接入
随着数据库技术的成熟和广泛使用,商业数据的不断积累,希望获得数据深层次信息的需求越来越强烈.联机分析处理OLAP(On-LineAnalyticalProcessing)技术就是用于解决海量数据高
该文从讨论网络安全问题入手,总结了目前比较流行报废火墙系统的体系结构和应具备的主要功能.通过对以太网中数据帧格式的详细分析和对TCP/IP协议族的具体了解,并根据LINUX操
随着计算机网络的飞速发展和计算机的日益普及,人们对计算机应用的要求也越来越高.网络化、可视化和智能化已经成为当代计算机应用软件必备的特特.在这种形势下,对应用软件开
学位
开放平台以服务的形式将计算、网络以及存储资源开放给应用开发者。然而,由于开发者水平参差不齐,无法保证应用的稳定性,具有开放平台访问权限的应用可能存在频繁地请求访问