面向Folksonomy组织优化的标签相关度研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:yinqing68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0概念的迅速传播,标签技术被广泛应用于包括网络书签、博客、网摘、视频分享等在内的多种服务,尽管标签能够简单地实现网络资源的描述和定位,但标签词是无控制的自然语言,不可避免地存在语法错误、一词多义、同义词、语义模糊、概念粒度差异、多语种交互等问题;同时标签词形成的是平面结构,词汇之间缺乏概念关联,也不能进一步揭示资源之间的关系:这些局限性为资源的浏览和检索造成了不便。   实际上,基于标签的大众标注系统中蕴含着非常重要的标签语义信息,而这种语义关联挖掘的基础在于标签之间的相关性度量。因此,本文在国内外相关研究基础上,重点研究了共现系数、上下文(资源、标签、用户)、互信息、FolkRank等标签相关度衡量方法。通过实验评测比较各种方法在标签数据集上的表现,根据实验结果分析各种方法的优缺点以及各自的适用情景,为实际应用中的方法选择提供决策参考。   引入基于结构上下文的SimRank算法计算标签相关度,一方面可以解决已有方法的数据稀疏性问题,另一方面可以挖掘出更多间接和隐含的相关关系,设计实验进行评测。基于SimRank的实验结果,通过聚类技术对相关标签进行分组展示。针对Folksonomy中标签应用存在的几类问题,探索了标签相关度和标签聚类可以在大众标注系统资源的关联组织方面提供哪些优化解决方案,包括原理方法、基本流程和原型图示等。  
其他文献
《图书情报工作》即将迎来创刊55周年之际,编辑部约我一定要写篇文章。推辞不掉,只好遵命。在我为它工作的30年(1975—2004年)和担任主编的12年(1992—2004年)间,已写过不少对它宣介
共现现象是存在于论文数据中的普遍现象。各种类型的特征项共现将离散的论文数据联结成一个有机的整体,可以从多个角度揭示科学活动规律。通过挖掘共现特征项之间的关联,共现分
所谓名刊,指获过多次奖励,能吸引高质量稿源,在某一学科领域声望、口碑具佳的刊物;所谓大刊,指历史悠久、载文量高、涉及面广的刊物。每一个学科几乎都有这样的刊物,如果按某某评价
最近,编辑部约我为纪念《图书情报工作》创刊55年写点什么。为此,我做了一点功课,查阅了一些相关资料,其中有一本纪念文集《使命:构筑科学信息平台——〈图书情报工作〉50年庆》引
欣闻中国科学院主管、中国科学院文献情报中心主办的《图书情报工作》创刊55周年,特向贵刊及其办刊人表示最诚挚的祝贺!我是《图书情报工作》的老作者、读者、也是审稿者,对这
其实我在《图书情报工作》上发文章是很晚的事,但《图书情报工作》长久以来却是我非常尊重的学术期刊。究其原因,大约有两个方面:一是在刚刚接触图书馆学时,是《图书情报工作》帮
时光荏苒,往事如昔,《图书情报工作》已经走过了55年的发展历程,在编辑部和杂志社一代代同仁的不懈努力下,期刊坚持改革创新,密切结合我国图书情报事业的发展实践,组织学术研究,开展
《图书情报工作》自创刊以来已走过了55个年头,作为多年在图书情报领域辛勤耕耘的核心期刊,对图书情报专业的学术传承贡献巨大。每当抚摸着《图书情报工作》蓝皮、黄皮的期刊
美术欣赏是一种精神活动,长期以来,它在人的整个心里活动和实践中占有重要的地位。小学美术欣赏教学对提高学生艺术修养、培养审美能力、激发创造力、陶冶情操、促进学生全面发
在举国上下共庆中国共产党建党90周年之际,《图书情报工作》(以下简称《工作》)喜迎55华诞。从创刊至今,《工作》数十年如一日艰苦奋斗,开拓创新,取得了辉煌成就,可喜可贺。《工作》