论文部分内容阅读
现在移动手机的使用已经在我们日常生活中广泛地传播,我们利用移动手机作为照相机,收音机,随身听以及浏览网络的工具。由于大部分的网页是为桌面计算机设计的,很难用小的屏幕设备来浏览它们。因此,计算机科学领域兴起了极大的兴趣把具有丰富内容的网页嵌入到我们移动设备小屏幕上。由于移动设备的屏幕较小,输入设备使用困难,因此用户希望只要一次搜索就能达到目的。但是,每个Web网页都有很多小模块,而不同的部分对于终端用户来说有不同的重要性,因此,如何利用最便捷的方式来确定终端用户最感兴趣的网页部分,并保证信息集成完整而不会产生信息损失,是一项值得研究的内容。与屏幕相关的两个缺点是:分辨率过低,因此一些促使像素提升的方法并不凑效;过多的网页内容导致显示的不方便。移动搜索系统采用客户端-服务器架构来满足移动浏览的要求。在客户端,开启一个Lobo驱动器实例在屏幕上等待用户的搜索请求,当一个请求发生,用户选择其中一个结果,服务器便开始计算。服务器首先从客户端接收URL和关键词,然后服务器把URL发送给一个解析函数对HTML代码进行解析,并把它转化成文档对象模型(DOM)表示。前向遍历DOM树,得到节点信息并进行停用词过滤和词干提取处理,保证得到所有根词。保存所有的根节点并计算各自的TF-IDF值,然后服务器可以计算网页各部分的后验概率值。这时,可以通过比较关键词与根节点来发现需要的值。计算关键词的后验概率值并与网页各部分的概率值进行比较,最终得出可以向用户展示的最合适部分。结果显示,该方法表现出很好的准确性,不过随着关键词的长度增长,虽然发现重要部分的时间不会显著增加,但准确性会有一定下降。