论文部分内容阅读
WWW已经发展为拥有近一亿用户和大约400万站点,3亿页面的巨大分布式信息空间,且其信息量仍以指数形式在飞速增长。但由于它上面的信息具有开放性、动态性和异构性使得人们很难快速地从WWW上获得所需信息。搜索引擎的出现使人们从大量信息资源的集合中找到与给定查询请求相关的、数目恰当的资源子集成为可能。本论文的主要工作是对搜索引擎技术进行研究并对中文搜索引擎加以设计和实现。 本文首先对搜索引擎的发展现状进行了介绍,对搜索引擎的工作原理及关键技术进行了分析,然后说明了中文搜索引擎的设计与实现并介绍了实现中用到的相关技术。 本文的主体是使用Java语言和多线程技术对搜索引擎进行设计与实现,在实现网页数据库时采用了JDBC技术,同时对中文信息处理也进行了一定的研究。 本文最后总结了完成的工作,以及日后可以改进和完善的地方。