论文部分内容阅读
随着信息技术的飞速发展,Internet已经发展成为当今世界最大的信息库,并且成为全球范围内传播信息和获取信息的最主要途径之一。计算机网络上出现越来越多的文本信息,这就对用计算机高效智能地处理自然语言信息提出了越来越高的要求,同时也对搜索引擎这种网络软件的体系结构提出了更高的要求。本文首先研究了中文文本Web搜索引擎设计中面临的关键技术以及相应的设计与实现,包括:搜索引擎的基本体系结构以及设计时应考虑的问题并且给出了实现。然后介绍了分布式计算中的负载平衡技术,可扩展标记语言XML技术以及Windows 后台服务程序的设计原理。接下来较详细地介绍了分布式搜索引擎系统的体系结构,系统整体工作流程以及各个功能模块描述。最后,对搜索引擎软件未来的发展进行了几点展望。