社会化标注系统中不同主题资源的用户标注行为分析

来源 :山西医科大学 | 被引量 : 2次 | 上传用户:isgongping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的社会化标注是Web 2.0技术的典型应用。随着互联网的发展和普及,越来越多的互联网应用平台均采用社会化标注功能,允许众多用户以标签的形式参与到网络信息资源的评论和分享,以便用户描述并揭示网络信息资源的内容。然而,社会化标签存在着选择随意、语义表达模糊、义同词不同以及词同义不同等问题,降低了用户对信息资源的使用效率,限制了标签的实际应用效果;同时,也在一定程度上降低了基于标签的信息组织和检索系统的质量。本文选题来源于国家社会科学基金项目“基于框架网络本体的标签系统语义分析研究”(13TCQ030)。通过标签对社会化标注系统中不同主题资源的用户标注行为分析与研究,一方面能够真实地揭示和了解用户在社会化标注系统中的标注动机和标注方式等信息,达到全面理解用户标注行为的目的;另一方面能够找出制约用户检索、利用和管理网络信息资源的主要因素,以此改进标签的使用;进一步提高网络信息组织和检索效率,充分实现对资源信息的传播、共享与利用;同时,能够优化社会化标注系统的结构功能和应用服务,达到全面促进社会化标注系统可持续发展的目的。方法基于自主开发的标签抓取软件(社会化标签知识采集系统)对社会化标注资源网站豆瓣网上“互联网”、“健康”与“心理学”主题资源数据抓取,运用文献调研法整理相关文献,提出本课题研究方向;运用实证研究法、统计描述法、差异分析法从标签的语言类型、词性统计、用语规范性、功能类型、情感、标注倾向、词来源等方面进行了定量分析和标签类型比率的用户标注行为量化指标进行了定性分析。结果特征分析的结果表明:①用户偏向使用名称、动词、形容词等词性的中文标签;②用户的标签用语具有不规范性,更多时候用户选择非叙词和非类目名称词作为标签标注资源;③用户倾向使用具有描述型功能的主题词标签进行标注资源用来揭示图书主题内容;④用户偏向使用评价型标签和情感型标签标注资源,便于其他用户关注该资源并有利于资源的分享;⑤用户标签标注倾向不高,大部分用户从未对图书添加标签,并且标签来源于标题的占比偏低。差异分析的结果表明:不同主题资源对用户标注行为存在显著性差异体现在标签的语言类型、标注倾向和词来源等方面,在标签的词性统计、用语规范性、功能类型和情感等方面不同主题资源对用户标注行为显著性差异不明显。结论社会化标注系统应该从提高个性化推荐服务功能、增加对不规范标签的纠正功能、完善标签检索功能、增加标签导航功能和完善标签浏览方式等方面进行结构功能和应用服务的优化,对促进社会化标注系统的可持续发展具有重要意义。
其他文献
随着社会不断的发展,电能的需求不断增加。另一边传统化石能源不断的使用,造成大量城市的环境污染,促使太阳能、风能、潮汐能为代表的清洁能源快速发展,分布式发电技术也伴随清洁能源开发的浪潮大力发展,日益成为电网的重要组成部分。然而,分布式发电装置在电网侧突然失压的情况下,如果仍与电网连接,将可能会对发电设备和有关检修人员人身安全形成威胁。因而,设备在并网发电之前需要对其防孤岛性能进行测试。传统的分布式电
分级诊疗制度对满足民众日益增长的优质医疗服务需求具有重要作用,但是我国分级诊疗制度的实施,面临着医疗服务供给不均衡、不充足的问题,集中体现在分级医疗体系功能定位与