基于语用信息的中文专利检索系统

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:talen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利信息是人类智慧的结晶,它几乎囊括了一切应用领域中的技术成果,涉及经济发展、科技创新和战略决策等最重要的信息资源。在当今国际市场竞争极为激烈的形势下,专利信息是各国发展经济不可或缺的重要资源。本文将语用信息和专利信息检索相结合,在基于传统关键字检索的基础上给专利检索赋予语用含义,以提高检索的查准率和查全率。本文主要工作包括如下几点:(1)根据国际专利分类法(IPC)分类规则,手动下载专利文献并构建了包含有语用信息的专利语料库,为后续的研究打好基础;(2)对语用信息进行大量研究之后,提出了专利语料中语用信息的概念以及抽取规则与抽取方法,将抽取出来的语用信息添加到专利语料库中用于专利检索以提高检索的查全率与查准率;(3)以上述技术为基础,以问答系统为平台,构建了一个基于语用信息的中文专利检索系统,实现了对专利信息的有效查询,通过对加入语用信息前后实验结果的对比,表明语用信息的加入使得专利检索查准率与查全率在一定程度上得到提高。论文最后是结论和对未来进一步工作的展望。
其他文献
抑郁症是一种以心境障碍为主的精神障碍疾病,发病率约为6.1%且呈逐年上升趋势,给家庭和社会造成极大负担,但其诊断正确率偏低,误诊率偏高。基于脑功能连接的多元模式分析是抑郁症
学位
随着经济的发展,人们生活水平的不断提高,各种服务机器人应运而生。目标跟踪技术是实现服务机器人与使用者友好交互的关键环节。各种跟踪算法和理论在视频图像序列的目标跟踪
手写汉字识别是一个典型的模式分类问题,它具有类别多、维数高的特点。目前常用线性判别分析(LDA)方法降维到低维子空间来解决。然而由于汉字识别的类别数(几千类)远大于特征
粮食是国民经济的基础,在努力提高粮食产量的同时,有必要保持合理的粮食储备。采用合理的粮食储藏技术有助于保持粮食品质、减少虫霉危害和有毒有害物质的污染。可以说粮食储
电镀天车调度问题是一类具有时间约束、次序约束和资源约束的组合优化问题。在理论上已经证明,电镀天车调度问题是一个N-P难题,而解决这一问题的关键在于研究和应用性能良好的优化调度方法。目前多数对自动化电镀生产线天车调度问题的研究均集中在单一天车、单一产品的环境下,以提前规划的方法,求得最佳天车行程路线。但实际电镀生产线通常用多辆天车同时运行以提高搬运效率,一条生产线也不仅仅只加工一种产品,而采取这种提
目前的语音识别技术在研究和应用领域都取得了很大的进展,口语对话系统就是其中的一个热门应用。语音识别作为对话系统的前端模块,其性能直接影响整个系统的性能。但在传统的
换热网络操作条件时常变化,旁路控制是调节物流出口温度、持续节能降耗的有效途径。复杂换热网络变量众多且耦合严重,若不予控制与观测,不利于热量传递与安全监测。旁路和测
随着现代战争中打击技术的不断发展,捷联惯性导航系统以其结构简单、成本低廉及自主导航等特点被广泛应用于各类战术导弹中。初始对准技术是惯性导航的关键技术之一,其精度和时
在现代社会中,火灾、爆炸、坍塌等事故常有发生,为了尽快找到受伤受困人员,并及时进行救援或将受困受伤人员的信息带出到救援人员处,应用机器人及时探知险情和受困人员的情况和位