基于本体的农业知识问答系统智能检索技术研究

被引量 : 0次 | 上传用户:hawk216813
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今网络技术的飞速发展,加快了各领域信息化的步伐,信息化技术也逐步向农业领域渗透,极大地推动了农业信息化的进程。“十二五”规划期间,农业信息化已经被明确成为我国社会发展和国民经济前进的重要任务。农业领域知识具有地域性、时效性、复杂性等特点,而服务主体——农民的科技认知水平普遍较低,在农业信息化服务中,如何从海量多样的数据中获取人们需要的信息,已经成为研究热点。问答系统的产生和发展,改善了传统搜索方式的不足,它允许用户以自然语言的方式进行提问,并返回给用户精确答案,而不是相关网页和信息。现有的问答系统在进行答案检索时大多采用对问句的关键词进行匹配的方法,而很少涉及句子或词语的语义理解层面。针对上述问题,本文引入本体(Ontology)概念,将农业本体论(Agriculture Ontology)用于农业知识的组织和管理,为问答系统的检索提供知识语义网络基础。本体是对概念和概念之间的关系进行规范化的描述,搭建出某个领域的知识体系,使知识具有很好的共享性和重用性。农业本体是对农业领域知识中的概念和概念之间的关系以计算机可识别的形式化描述语言进行组织。本体的引入在一定程度上解决了在语义理解层面的不足。以柑橘为例构建一个小型的柑橘病虫害知识本体来协助问答系统的问题理解、信息检索和答案抽取等过程的完成。在分析柑橘病虫害领域知识的基础上,给出了柑橘病虫害知识本体的形式化定义和元数据语义关系定义,确定了本体构建框架及核心本体,并运用本体开发工具Protege实现了柑橘病虫害知识本体的构建。针对农业领域特点,对用户提出的问句进行预处理,使用特定分词器进行分词。基于领域本体进行问句语义理解,提取问句关键概念及其扩展概念。利用Lucene对问题-答案库构建倒排索引,设计检索方案,确定候选问题集。结合已有的句子相似度算法,在本体的基础上,讨论了基于领域本体和基于知网的概念语义相似度算法,提出了多重信息融合的句子语义相似度计算模型,该模型综合考虑了句子的表层相似度和语义相似度。将用户问句与候选问题集中的问句进行相似度计算,将达到阈值的问句按顺序返回其相应答案给用户。最后介绍系统总体设计,并通过实验验证了模型的有效性和正确性。
其他文献
脊髓损伤(spinal cord injury,SCI)不可避免造成神经元死亡及其轴突断裂,进而导致神经支配功能的丧失。支持和引导轴突生长是SCI修复的关键。作为支持和引导损伤神经元轴突生长的
水是人类赖以生存的源泉,随着社会的发展,人们对水质的要求越来越高,这就对给水厂的水处理工艺提出了更高的要求。混凝加药是给水处理工艺最为重要的环节之一,加药量过少水质
本研究目的在于透过文献探讨,编写《小学生阅读理解能力测验》,建构昆山地区《小学生阅读理解能力测验》年级常模,建立低阅读理解能力的分界标准,并探讨影响小学生阅读理解能力的
本文第一章介绍了股份制的产生和相关概念。讲述了在中世纪,随着股份合作制的发展,萌生出了原始股份制,经过漫长的发展过程,进入了近代股份制,一直到现代股份制,以及股份制进
金融业已经成为我国经济发展的主要支撑力量,与传统金融业相比,现代金融业作为知识密集型产业,在组织结构、业务流程和业务拓展等方面充分体现了知识和信息的重要性,金融业的
女性主义是基于天赋人权产生的、以男女平权或男女平等为核心的思想和理论。女性主义以对性别与社会的关系为聚焦点,以追求妇女的社会地位和家庭地位的平等。本文在综合反思
在漫长的反垄断司法实践中,相关市场界定的问题越来越受到各国人们的关注和重视,相关市场的界定问题已经成为反垄断案件经济分析的基础和关键。相关市场的使用,实质上是为了
实验目的:细菌性脑膜炎是儿童时期较严重的中枢神经系统感染性疾病,近年来,尽管给予有效的抗生素治疗,但是细菌性脑膜炎仍有较高的死亡率和致残率,因此进一步研究细菌性脑膜炎的免
FMCW雷达在探测冰川内部分层结构中,需要高分辨率来区分出冰川的每一层的结构,系统高分辨率的关键与FMCW信号源的线性度直接相关。在实际的FMCW雷达系统中,由于器件,环境等因素的
综合竞争力是近年来热门研究课题之一。综合竞争力是指在社会经济活动中,集散资源和辐射影响的能力。本文在产业集群、产业辐射等相关理论基础上,结合国内外大量研究,界定了