面向客户的电子目录本体自学习理论与方法研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:Test_518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着语义网技术和电子商务应用的快速发展,用户不得不花费大量时间在各种异构的、晦涩的目录海洋中寻求所需要的信息,企业在信息交换时,也存在难以互操作和语义集成的瓶颈。建立共享概念的明确的形式化规范说明可以很好地解决这个问题。电子目录本体除了能够满足用户的查询需求,也为计算机进行信息交换、语义搜索和信息识别提供了便利。然而手工建立电子目录本体需要大量领域专家的帮助,耗时又费力,更别说难以有足够的领域专家。因此自动构建电子目录本体满足客户需求是一项重大意义的工作。本文基于以上问题和现状,借鉴现有本体自学习的研究成果,以电子目录国际分类标准、本体论和语义Web理论为基础,利用自然语言处理领域的方法和技术,对面向客户的电子目录本体建模和电子目录本体的自学习方法进行了深入研究。主要的工作包括:(1)电子目录本体元模型的构建。电子目录本体元模型为电子目录本体自学习提供了一个统一的领域框架,本文结合客户需求,对国际目录分类标准进行语义扩展,设计了具有四个层次的电子目录本体元模型,并用标准规范化的语言进行了描述。(2)基于电子目录本体元模型自动构建目录本体:●基于目录网站层次的目录本体概念获取。基于电子商务Web网站的结构地图和对Web页面块的分析,设计了基于网站分类层次的目录本体概念获取算法,并进一步利用国际目录分类标准对获取的概念进行标准化处理。●基于语义和关联规则的本体概念关系学习。提出了基于模式匹配的电子目录本体层次关系的获取方法,探讨了动词在目录本体概念非层次关系中的重要性,提出基于语义关联规则对非层次关系进行挖掘的方法。●基于模式匹配和在线统计的概念属性识别。提出利用模式匹配和Web统计分析的方法来识别电子目录本体概念属性。并特别分析了目录本体概念数据属性的属性值和属性计量单位的自学习算法。●电子目录本体概念实例提取。基于目录本体概念实例处于电子商务网站结构中的叶子节点,提出了目录实例自动提取算法。(3)电子目录本体自学习实证。介绍了以Amazon.com电子商务网站为例的电子目录本体自学习过程,并给出了构建结果。最后对自学习的电子目录本体设计了评价方法,得出本文的电子目录本体自学习方法是有效的、有价值的。
其他文献
切实缩小城乡之间教育水平的差异,保证教育特别是基础教育的公平性,对于提升我国整体的教育水平、解决人民大众所关心的基本问题都有着非常重要的意义。然而,长期以来我国都