基于Lucene和Heritrix的全文检索引擎的研究与应用

来源 :电脑知识与技术:学术交流 | 被引量 : 0次 | 上传用户:zhui130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。Heritrix是一个开源的由Java开发的Web网络爬虫框架,用户可以使用它从网络上抓取想要搜索的资源。该文分析了Lucene的索引机制,探讨了Heritrix的结构框架,最后结合实例对基于Lucene和Heritrix技术的全文检索的应用进行深入研究。
其他文献
目的:探讨泡沫敷料在手术患者预防褥疮的临床应用。方法:将2014年1-12月间100例脑、骨科手术患者随机分为对照组和实验组。实验组给予常规预防压疮护理、泡沫敷料局部减压保
摘要:该文从信息技术网络考试系统的设计思想出发, 详细讨论了基于B/S三层结构的网络考试系统的功能模块、系统结构、开发环境以及数据的安全与保密方法。  关键词:网络考试系统;B/S三层结构  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)09-2089-03  考试是教学过程中不可缺少的重要环节,它可以检测教学效果和学生们对课程的掌握情况,以便教师在后续的教学中进
三个相同的形体按“品”字的结构聚合而成的汉字称为三叠同体品字形字。古代先民对于数字“三”的偏爱及三叠同体品字形字的特有的形体结构等因素使得这种汉字大量存在。三叠
2017年7月26日下午,室外气温达到40℃。合肥市长临河镇边的巢湖水域,有近60名工人在水里和水边清理近岸边的蓝藻,所有工人都大汗淋淋。据长临河镇政府人员介绍,光长临河打捞
期刊