面向个人学术主页的语义标注与检索研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:xianglongke2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,语义网的研究和应用越来越受到重视,语义标注作为语义网建设的重要步骤,解决了本体和资源数据的标注映射关系,决定着语义网的数据质量和检索的语义分析效果。本文研究面向个人学术主页的语义标注和检索,使用改进的学习算法对个人学术主页资源文档进行有效标注,提高识别效果的查准率和查全率,同时对语义检索提供支持。   本文首先介绍了语义网的基本理论和技术,如本体、语义Web标准语言、命名实体识别和搜索相关技术。其次,针对语言模型的序列标注,提出了改进特征模板的条件随机场模型,使用领域文档的特征实体和关系作为特征,对语料库数据进行训练和测试,通过实验的分析结果,验证了该算法可有效识别命名实体。再次,本文设计和实现了基于本体的个人学术主页领域的检索框架,使用标准化本体建模工具构建领域本体,并通过中文相似度计算公式扩展本体概念及其他术语。利用资源描述框架(ResourceDescriptionFramework,RDF)语言对文档数据进行标注,生成三元组格式文件,然后使用RDF解析工具Jena2和索引工具Lucene3.0和其他B/S系统开发技术建立个人学术主页检索系统。最后,对本文的主要研究成果进行了总结,并展望了未来的研究工作。   总之,本文的研究成果对个人学术主页领域的语义标注的研究和检索的开发具有重要的应用价值,对语义网的建设和语义搜索引擎的发展也具有很好的借鉴作用。
其他文献
随着地质勘探、测井解释技术的不断发展,测井原始数据作为测井解释的基础,其数据格式、信息量对于测井解释平台以及日后的解释工作都起着至关重要的作用。  在实际应用中,由于
随着互联网技术的迅猛发展,互联网中的资源呈现出爆炸式增长的态势。如何从海量的资源中准确定位到适合用户的资源逐渐成为工业界和学术界的研究热点。推荐系统在这样的背景下
卡片质量检测是对卡片表面的缺陷,如污迹、划痕、色差、漏印等印刷缺陷进行检测。以检测结果根据质量标准对卡片进行优劣判定。机器视觉技术是用视觉采集系统来提取待测目标图
RCP(Rich Client Platform)是Eclipse插件开发的一种应用,改变了Java在桌面应用开发领域中的劣势地位,而uDig是基于Eclipse RCP开发的一款开源桌面GIS软件,可以在其基础上方
人脸识别是模式识别领域中最热门的研究课题之一。它主要包含预处理、人脸特征提取和分类器设计。人脸特征提取也称人脸表征,是对人脸进行特征建模的过程,目的是提取出原高维
人脸检测是计算机视觉领域的重要课题,最早作为人脸识别系统中的定位环节被提出。经过近二十年的时间发展,人脸检测研究取得了显著的进步,目前在人脸识别、新一代人机交互界
随着移动互联网产业的持续快速稳定发展以及3G时代的进入,各种手机平台提供了丰富有效的应用运行平台。但目前的系统平台多元化,开发方式迥异,使得应用开发复杂,开发周期长,
人脸的研究是跨越人文科学与自然科学的新兴交叉研究领域,在最近几年得到了模式识别领域众多学者的重视,也取得了良好的研究成果。针对人脸这种生物特征的识别,在其过程中最
随着油田计算机的普及,地层自动分层大多采用图形方式进行。现有的一些地质分析家软件、所有的曲线分段都由人工完成,导致对同一曲线的划分因人而异,最终导致地层划分误差的增大
传统手写书法是中国,日本,韩国和越南等国家最主要的一种艺术形式。然而现在,很少人在日常生活中练习他们的手写字体,更不用说书法了。所以本文希望能够有一种自动化的方法来