汉语特定领域本体的自动构造研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:cdxwindows
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体在智能信息集成、信息管理、自然语言处理等领域发挥着越来越重要的作用。目前本体的构造大多基于人工方式,需要大量的时间和费用,已不能满足本体应用的需要。因而本体的自动构造已成为该领域的研究热点。本文主要研究自动构造本体的技术,提出了一种利用专业语料集合自动构造领域本体的方法。主要的工作及创新点包括以下几个方面:1)已有本体构造方法研究本文比较研究了目前常见的若干本体构造方法,分析了各种方法的特点,这些方法大都基于人工或半人工的方式;研究了自动构造本体所涉及的关键技术,包括术语抽取技术、概念学习技术、关系挖掘技术等。2)领域术语自动抽取术语抽取是本体构造的第一步。本文提出了以词语在专业语料库和背景语料库(平衡语料库)出现的概率对比作为特征的术语自动抽取方法,并采用对数似然比进行术语的领域相关度评分,取得了比较满意的效果。3)概念发现和关系挖掘本文将复杂网络中基于小世界模型的G-N算法成功地引入到了统计自然语言处理领域。在构建术语网络过程中,运用向量空间模型,将术语上下文共现信息结合知网语义相似度进行术语相似度计算,更准确的衡量了术语之间的相似性;在此基础上,运用G-N算法对术语网络进行聚类分析,发掘领域概念,并挖掘出概念及术语间的上下位关系。4)领域本体自动构造系统通过综合运用本文研究的方法,我们设计并实现了基于领域文本的本体自动构造原型系统,实验构造了计算机专业领域的本体结构。
其他文献
电子测试测量技术已经涉及国民经济的各个行业,实时频谱仪(RTSA)是世界上唯一为专门解决数字RF问题设计的分析仪,在无线通信,无线监控和雷达设计等领域有广泛的应用。在通过PC机
云计算是一种融合了分布式计算、效用计算、网格计算等相关技术的新型商业化计算模式,采用成熟的虚拟化技术将大规模同构或异构资源抽象为服务,并通过网络按需提供给云用户。资源分配策略研究已经成为当前云计算领域的热点,它具有的商业化特点及经济学特性促使许多研究者采用经济学相关理论和方法解决云资源分配,并取得了一定的成果。本文在分析经济学在云计算资源分配领域研究现状的基础上,将其中的一个重要分支——拍卖模型引
随着互联网的发展,当代社会已经进入了网络社会,其中,局域网在人们生活和工作中的应用越来越深入,在企业、政府、学校等各种场所,起着非常关键的作用。相对于外部网络,局域网内部的
天然气管网是城市基础设施的重要组成部分,是城市赖以生存和发展的物质基础。但是长期以来对天然气管网资料采用传统的手工管理方式,导致了管理工作繁重、效率低下,数据利用率低
题库是高校的一项重要资源,应具有极大限度地共享性。目前,有相当一部分院校的试题停留在孤立电子文档管理阶段,共享性差,已有资源利用率相当低,命题重复性劳动大。本系统将提供一
视频通信是多媒体通信的主要应用方向之一,然而目前大多数的有线、无线通信网络均不能提供可靠的服务质量保证,视频信息传输过程中面临着不可避免的差错和损失。最新的视频编码
随着计算机与网络技术的飞速发展,信息系统的应用日益广泛,数据的交换日趋频繁。因此,如何保障信息系统的安全性,是一个非常重要的问题。而数据库作为信息的载体,它的安全性对整个
恶性黑色素瘤,是一种发病部位在皮肤表面,由人体黑色素细胞产生异常增生而诱发的恶性肿瘤。在皮肤癌的死亡病例中,恶性黑色素瘤引起的死亡人数约占总数的2/3。通常,恶性黑色
生物特征识别技术是利用人类自身生理或行为特征进行身份鉴别的一种技术。人的生理特征包括指纹、手形、掌纹等,行为特征包括签名、语音等。与基于ID卡、口令和密码的传统身
Internet已经成为人们日常生活中的主要信息来源之一。搜索引擎是人们在Internet查找所需信息的主要工具。目前主流的搜索引擎主要采用用户查询词与网页中的关键词精确匹配的