论文部分内容阅读
中文微博信息是具有特别保存价值的原生数字资源,其长期获取面临风险,保存机构必须采取措施保障其可以得到长期利用。目前中文微博信息保存相关的研究、实践缺失,亟待引起研究人员以及保存机构的重视。微博信息的采集是微博信息长期保存的起点,决定着长期保存能否达到预期的效果,是保存机构面临的首要问题。本文即以此为切入点,对中文微博信息采集的关键问题进行了研究探索。 首先,论文对中文微博信息长期保存的必要性进行了分析。通过对微博信息保存价值的分析论证,论文指出微博信息具有科学研究意义、社会记忆作用,是人类数字文化遗产的组成部分。由于微博信息的保存价值受到质疑,且所处的网络环境具有不确定性,论文指出微博信息的长期获取面临风险。开展中文微博信息的长期保存活动具有必要性和迫切性。 其次,论文将中文微博信息采集的关键问题确定为采集范围的圈定、采集权利的获取和采集模式的选择三个,基于在不同问题上微博信息表现出的特性,并借鉴网络信息保存已有的研究成果,论文对应提出了“完整性”采集、CC协议结合剔除策略、通过调用API的采集模式三个对策加以应对。 最后,论文从责任体系与法律制度两个角度构建了对策实施的长效环境。论文提出应明确微博信息采集各利益相关方的责任划分,建立合作关系,并以新浪微博为例构建了基于采集关键问题的中文微博信息合作采集框架。通过对与采集相关的法律制度现状进行分析,提出应加快其完善进程。