WWW上的信息发现与搜索引擎技术

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:myd1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet在我国逐步得到普遍应用以及WWW上中文信息量的不断增长,迫切需要研制适合我国国情的中英文Web索引和检索服务系统。WWW的信息发现和搜索引擎又称为robot,负责搜索和获取指定范围内的有关数据。本文对Web搜索引擎的工作原理和关键技术进行了讨论和分析,并介绍了我们在研制中英文Web索引和检索服务器方面所做的工作,包括系统总体结构和汉语分词技术等。 With the gradual universal application of the Internet in our country and the increasing amount of Chinese information on the WWW, it is urgent to develop a Chinese-English Web indexing and retrieval service system that suits our national conditions. WWW’s information discovery and search engines, also known as robots, are responsible for searching and retrieving relevant data within a specified range. This paper discusses and analyzes the working principle and key technologies of Web search engine, and introduces the work we have done in developing Chinese and English Web indexing and retrieval servers, including the overall structure of the system and the Chinese word segmentation technology.
其他文献
生活质量是近年来人们比较关注的问题,但是精神生活质量的内涵及衡量指标等问题却较少为人关注,因而一直是十分模糊的。中山大学教育学院的廖小琴老师撰文就精神生活质量的衡
北京市东城区和平里第四小学始建于1960年,占地面积7200多平方米,环境优美、设施齐全、设备先进。学校办学指导思想是:“全面、和谐、高质、特色、一流”;培养目标是“志向远
园林施工是现代化城市建设的重要内容,其对于美化城市环境、改善空气质量有着重要影响,因此应加强园林施工管理,采取科学合理的养护改善措施,充分发挥园林工程的重要作用。基
作者从1992年10月至1994年12月,应用果胶酶治疗胃石症23例,均在24小时内消除胃石,成功率百分之百,取得了满意的疗效。现总结报告如下。 1.临床资料 发病年龄,4—26岁。男性1
慢性贲门炎内镜分型及与贲门癌的关系陈正言本文探讨了经内镜确诊的慢性贲门炎的内镜表现及分型,并试图从发病年龄初步探讨其与贲门癌的关系。一、内镜资料及分析1.一般资料:胃镜
看见我走进教室,孩子们的眼睛就亮了:“陆老师来了!”“猜猜,我今天的心情怎么样?”我做出一个微笑的表情。“你很开心!因为,你脸上都笑开花啦!”“让我猜猜,你们的心情怎么
用BSA免疫组化法检测慢性乙型肝炎患者外周血T淋巴细胞亚群郑茉莉,李灼亮(空军广州医院传染病科广州510602)本文用生物素-链霉亲和素(BSA)法和碱性磷酸酶·抗碱性磷酸酶(APAAP)法,同时对比检测40例慢性乙型
本文对国产及进口CHE试剂进行评价,两种试剂的组成及不同温度下的稳定性相同,精密度良好(CV均<5%),相关系数为0.9826~1.054.国产试剂吸收峰为410nm,线性16500u/L,回收率97.5%~101.1%,平均98.6%,正常参考范围6634±±2956u/L,进口试剂吸收峰为405nm,线性14500u/L,回收率
基于Browser/Server的远程故障诊断专家系统具有许多优点和良好的性价比。本文介绍了其基本结构和工作原理,对实际系统所运用的关键技术也进行了研究和讨论。 Browser / Server-based remot