移动搜索系统中基于DOM的自动网页卷滚

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ahfnhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在移动手机的使用已经在我们日常生活中广泛地传播,我们利用移动手机作为照相机,收音机,随身听以及浏览网络的工具。由于大部分的网页是为桌面计算机设计的,很难用小的屏幕设备来浏览它们。因此,计算机科学领域兴起了极大的兴趣把具有丰富内容的网页嵌入到我们移动设备小屏幕上。由于移动设备的屏幕较小,输入设备使用困难,因此用户希望只要一次搜索就能达到目的。但是,每个Web网页都有很多小模块,而不同的部分对于终端用户来说有不同的重要性,因此,如何利用最便捷的方式来确定终端用户最感兴趣的网页部分,并保证信息集成完整而不会产生信息损失,是一项值得研究的内容。与屏幕相关的两个缺点是:分辨率过低,因此一些促使像素提升的方法并不凑效;过多的网页内容导致显示的不方便。移动搜索系统采用客户端-服务器架构来满足移动浏览的要求。在客户端,开启一个Lobo驱动器实例在屏幕上等待用户的搜索请求,当一个请求发生,用户选择其中一个结果,服务器便开始计算。服务器首先从客户端接收URL和关键词,然后服务器把URL发送给一个解析函数对HTML代码进行解析,并把它转化成文档对象模型(DOM)表示。前向遍历DOM树,得到节点信息并进行停用词过滤和词干提取处理,保证得到所有根词。保存所有的根节点并计算各自的TF-IDF值,然后服务器可以计算网页各部分的后验概率值。这时,可以通过比较关键词与根节点来发现需要的值。计算关键词的后验概率值并与网页各部分的概率值进行比较,最终得出可以向用户展示的最合适部分。结果显示,该方法表现出很好的准确性,不过随着关键词的长度增长,虽然发现重要部分的时间不会显著增加,但准确性会有一定下降。
其他文献
倒排索引是目前应用最为广泛的全文索引技术,是现代搜索引擎的核心技术。现在互联网上文本数据呈现爆炸式增长,为这些文本数据构造的倒排索引也需要越来越多的存储空间,压缩
随着软件开发的发展,系统结构的日益庞大,漏洞修复和新功能的扩充将贯穿于整个软件生命周期,软件升级作为软件维护的重要支撑起到了不可或缺的作用。现在越来越多的软件具备了自
近年来,随着计算机相关技术及图形图像技术的广泛应用,医学图像的质量和显示方式得到了极大的改善,从而借助于图像处理与分析技术使得诊疗水平大大提高。医学图像的三维可视化是
负载均衡技术是并行文件系统中常见且不可或缺的重要优化手段。在并行文件系统中实现副本技术,利用负载分析方法和调度算法,可以有效地将系统中各种负载均衡地分配到各存储节点
随着互联网技术的发展和网络规模的扩大,人们对远程登录的需求也变得十分迫切,很多企业、组织对网络设备以及服务器的管理都需要使用远程登录服务。因此远程登录技术成为了非
随着科学技术的快速发展,越来越多的企业或单位开始利用虚拟机搭建数据中心来应对日益增长的计算需求。然而,随着数据中心虚拟机数目的不断增加,单个虚拟机发生故障从而导致整个
视觉物体表示(visual object representation)是联系底层图像信息和高层语义概念之间的纽带,在物体识别、图像检索等计算机视觉任务中起着关键性的作用。基于鲁棒性局部图像特
在现在的经济社会中,大量的商品和服务的支付都需要使用银行交易业务。银行系统在金融机构中的作用越来越重要,这直接关系到金融机构的盈利和为其客户提供便利服务。世界银行
随着互联网的发展,大数据时代悄无声息地走到了我们身旁,每天用户各种各样的行为产生了数以亿计的数据,这其中就包括了社交信息,购物信息以及浏览信息等。大量数据中包含着很
随着高速铁路的快速发展,高速移动通信网络成为高速铁路信息化建设的重要方向之一。高铁移动通信网主要分为铁路专网和用户开放式网络。本文根据特定的用户开放式高铁移动通