一种服务于现有搜索引擎的应用内数据转化技术

来源 :南开大学 | 被引量 : 0次 | 上传用户:hebe2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前众多小微APP存在“信息孤岛”问题——很多APP内的数据在Web上无法访问到,特别是现有的搜索引擎无法快速定位到这些信息。应用内搜索技术,就是专门解决“信息孤岛”的技术,它将APP内信息通过搜索结果的形式呈现给用户,用户通过点击相应搜索结果即可直接跳转至开发者Native APP的指定页面。  本研究的目的在于进一步推进应用内搜索技术。研究主要基于UIAutomator和Appium,完成了应用内数据的自动化爬取框架,将应用内数据与传统强大搜索引擎技术对接。研究的意义在于获取了应用内结构化的完整数据,而非原始的、逻辑不完整的服务器端数据,同时将这些数据对接搜索引擎以方便人们快速的搜索定位,特别是还产生了很多有价值的测试相关数据,记录了程序的崩溃信息和异常信息,帮助程序员们规范化地编程。本研究还进一步在大数据的背景下,尝试和基于Wi-Fi的推荐技术、金融数据应用结合,形成数据应用的闭环。  本研究的核心创新点主要为:(1)对存在“信息孤岛”的目标APP的分拣及爬取技术。(2)该类APP的结构解析、应用内数据提取以及适应现有搜索引擎的数据转化技术。
其他文献
当前,承受精神压力的人越来越多,心理健康问题已成为人类面临的一项重大挑战。精神压力识别可以帮助人们及时采取有效措施,缓解精神压力,保护心理健康,具有十分重要的研究意义。过
系统虚拟化技术是当前学术界与产业界广泛研究与探讨的一项信息技术,由于其在资源管理、服务器整合、绿色节能、安全隔离等方面的优秀特性,在当前日益兴起的大型数据中心与云
随着社会信息化程度不断提升,各种形式的电子数据积累越来越多,且产生速度不断加快,传统的数据库系统难以快速高效地从这些超大规模的数据中挖掘有效信息。频繁项集挖掘是一个典
图像分割是图像处理中的重要研究课题,随着图像处理技术在生产和生活中的广泛应用,图像分割也受到人们越来越多的重视。它作为图像处理中的关键环节,决定着最终的处理质量。由于
Max-SAT问题是一个著名的约束满足问题,在理论研究和实际应用中都有重要的意义。局部搜索框架是一个非常有效的解决带权重的Max-SAT问题的框架,本文提出了一种新的启发式的变量
随着多线程库的日益普及和多核处理器的快速发展,多线程软件技术被越来越多的开发者所使用。而在多线程软件中,并发错误是最难以处理的错误之一,不仅因为线程的调度受到操作系统
互联网时代的来临带来了数据的爆炸式增长,也使得传统的数据存储方式遭遇了新的挑战:虽然网络带宽和磁盘容量快速增加,但成几何级增长的用户数和应用需求,使得传统的数据分布式
随着经济的不断推进和信息技术的不断发展,以提供信息服务为目的数据密集型计算机应用系统越来越普遍。而信息系统的主要任务就是最大限度的利用现代计算机技术及网络通讯技术
随着信息技术的进步和互联网的不断普及,网络中涌现出大量的开源文本。海量开源文本的出现给信息抽取技术的发展带来了巨大的机遇和挑战。同时,在社会计算兴起的大背景下,针对安
点型紫外火焰探测器性能检验装置在国家消防电子产品质量监督检验中心执行国家标准GB12791-91《点型紫外火焰探测器性能要示及试验方法》过程中发挥着重要作用.它主要对点型