档案信息搜索引擎研究与设计

来源 :吉林大学 | 被引量 : 0次 | 上传用户:panzx777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet上中文信息的增加,智能化搜索引擎已成为中文检索技术未来的发展目标与趋势.概念检索作为一种实现技术有着广泛的应用前景.该文回顾了搜索引擎的历史、国内外现状及基本技术,阐述了概念检索的意义,针对档案领域的需要,设计了一个基于概念语义网络实现概念检索的中文搜索引擎,并将其应用于档案领域.在设计方案中,以主题词为基本概念,利用概念语义网络作为词典和概念检索的知识库,实现概念检索;将非结构化的Web页面信息存储到结构化的数据库中,使得对Web页面的检索转化为对结构化数据库的检索;以正向最大匹配算法为基础,实现了Web文本的分词抽词,并在概念语义网络的基础上,进行主题词标引;以向量空间模型法为基础,设计实现了Web文本的自动分类.
其他文献
学位
随着通信、信息技术的飞速发展,以及自由贸易思想的渗透,全球化的市场基本形成,所以企业面临国内和国际上的竞争.激烈的市场竞争要求企业必须全面提高其T、Q、C、S水平.即不
该文研究和探讨了生产管理系统开发的技术环节及实现过程,并深入讨论了分布式多层结构在企业生产领域的实现.首先,阐述了分布式多层应用系统的编程思想及关键技术.介绍了分布
1)该文提出了一种适合城市交通网络分析的数据模型,将传统的基于弧段-节点的数据模型用基于完整交通特征的关联数据模型代替,设计出基于特征的交通网络关联数据模型的概念建
学位
在光照不均匀,存在阴影以及存在背景小杂色块干扰的图像中准确辨识出叶片图像,并将其显著特征抽取出来是本次课题的研究重点。本课题在对实际叶片图像信息抽取这个领域,提出
该文的主要内容是讨论细胞自动机的自演化方法及其内部运行机制,特别是遗传算法在细胞自动机自演化中的应用.首先我们介绍了细胞自动机的起源,发展,现状,还介绍了其主要特点
目前国内有一些相关领域的预测软件,如彩票预测软件等.这些软件只是实现该领域内的指标预测功能,预测的智能性较低,而且不具有通用性,不能进行跨越领域的指标预测.另外随着In
该文基于并行CORBA的原理,提出了油气储层随机建模的网络并行计算模型;改造了原有的串行计算代码;封装成并行CORBA对象,使之符合SPMD并行执行模型,解决了串行代码并行化的问
MPLS是一种新的网络技术,它将IP路由技术和ATM交换技术紧密结合,既实现了路由的智能,又利用了ATM交换机的高效硬件交换.该文首先介绍了MPLS的背景知识、技术原理、技术优势以