长期保存视角下的中文微博信息采集关键问题研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:tiefer34
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文微博信息是具有特别保存价值的原生数字资源,其长期获取面临风险,保存机构必须采取措施保障其可以得到长期利用。目前中文微博信息保存相关的研究、实践缺失,亟待引起研究人员以及保存机构的重视。微博信息的采集是微博信息长期保存的起点,决定着长期保存能否达到预期的效果,是保存机构面临的首要问题。本文即以此为切入点,对中文微博信息采集的关键问题进行了研究探索。  首先,论文对中文微博信息长期保存的必要性进行了分析。通过对微博信息保存价值的分析论证,论文指出微博信息具有科学研究意义、社会记忆作用,是人类数字文化遗产的组成部分。由于微博信息的保存价值受到质疑,且所处的网络环境具有不确定性,论文指出微博信息的长期获取面临风险。开展中文微博信息的长期保存活动具有必要性和迫切性。  其次,论文将中文微博信息采集的关键问题确定为采集范围的圈定、采集权利的获取和采集模式的选择三个,基于在不同问题上微博信息表现出的特性,并借鉴网络信息保存已有的研究成果,论文对应提出了“完整性”采集、CC协议结合剔除策略、通过调用API的采集模式三个对策加以应对。  最后,论文从责任体系与法律制度两个角度构建了对策实施的长效环境。论文提出应明确微博信息采集各利益相关方的责任划分,建立合作关系,并以新浪微博为例构建了基于采集关键问题的中文微博信息合作采集框架。通过对与采集相关的法律制度现状进行分析,提出应加快其完善进程。
其他文献
随着知识经济时代的到来,社会日益变得纷繁复杂,管理学的管理方式和管理观念也在发生着变化。柔性管理就是适应了这种社会的发展变化而发展起来的。柔性管理无论在东方还是在西
《什么是图书馆学》是一篇在历史转折期有引路作用的经典文献,它的发表曾引起一场大讨论,后又遭到批判和误读。重温刘国钧先生的旧作,我们感到作为我国学术大家和图书馆学一
回顾在1957年至1959年期间刘国钧先生与北大图书馆学系部分学生的生活、学习经历,对刘国钧先生为人、为学、为教进行细腻的写实。不仅还原了50年前令今人陌生的一段历史风貌,
简述开放存取自存档的涵义、存在意义、目前发展状态。认为开放存取自存档是学术信息交流的新的重要途径。分析开放存取自存档资源的版权问题、自存档知识库的互操作问题、自
图书馆权利是指在信息源—图书馆—信息受众的信息资源流动过程中三方权利的制衡关系。图书馆权利包括信息源权利、图书馆自身权利、受众权利三部分内容。权利冲突集中体现在
该论文以辩证唯物主义和历史唯物主义为指导,在调研的基础上,充分运用民族史料学、档案学、信息学等学科理论和方法,对白族历史档案信息资源进行全面系统的发掘,充分揭示其价
从推进企业档案管理改革与发展的目的出发,该文分析和预测了企业档案管理的转变.基于档案管理要为企业经营与管理、企业的生存和发展服务这一出发点,在遵循档案工作规律的基
本文在对宁夏扬黄灌区的同心县河草沟村的调查取样基础上 ,通过对灌溉地土壤灌溉前后以及灌溉地土壤与非灌溉地土壤之间的比较 ,分析了扬黄灌溉后 ,灌区土壤在盐分含量、土壤颗粒组成、土壤养分和土壤微量元素含量等方面的变化 ,以及这些变化对土壤沙化、土壤盐渍化和土壤环境质量等的影响。结果表明 ,扬黄灌溉在一定程度上抑制了土壤沙化 ,改善了表层土壤的盐分状况 ,提高了土壤肥力 ,但并没有彻底消除土壤盐渍化的
本文通过对荣华二采区10
期刊
在介绍并评价当前主要检索行为实验方法的基础上,引入美国Marvin Zelen教授的Zelen设计,综合已有检索行为实验方法的优缺点给出应用于网络用户信息检索行为实验的改进Zelen实