基于文本相似度的机器新闻内容质量研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:SF20070601ZW126com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,人工智能已经渗透到人们生活的方方面面,关于人工智能即将取代人类的言论不绝于耳,在这样的时代背景下,新闻业也迎来了自己的人工智能应用—机器新闻。它的出现同样掀起了其将来是否会替代新闻记者的热烈讨论。美国机器写作公司Narrative Science的技术负责人Hammond曾预言未来15年内,90%的新闻将由计算机撰写。对于机器新闻是否会替代记者的问题,当前研究中的评判大多来自研究者的主观思考,缺乏客观角度的量化研究。本文认为考察机器新闻是否替代记者,首先应当认识到机器新闻多大程度上可以达到记者的写作水平,这类问题涉及到计算机与人类的相似性,属于人机交互中计算机拟人化研究领域,该领域存在著名假设:人机交互系统中计算机的拟人化程度越高,人类对计算机的评价越好。基于以上假设,本文提出了自己的基本假设:机器新闻与人工新闻的相似性与受众对机器新闻内容评价之间存在相关性。本文借用自然语言处理中文本相似度的概念来描述两者的相似性。而对于内容质量的测评,本文借鉴了已有的机器新闻内容质量评价体系。研究样本方面,本文收集了腾讯Dreamwriter在2016里约奥运中的一系列金牌报道,以及国内其他三大门户网站—网易、新浪、搜狐的人工新闻报道作为样本库。本文在这些样本中,选取文本相似度差异较大的5篇机器新闻,与5篇同类人工新闻一并接受双盲测评,采用调查问卷的形式基于评价体系对机器新闻与人工新闻的内容质量进行测评。通过一系列的数据分析,结果验证了本文提出的所有假设,认为机器新闻与人工新闻的相似度与其内容质量存在正相关。在相似度差异的背后,本文也探索了导致相似度差异的影响因素,发现这些因素主要集中在客观层面,如客观性、清晰度、以及信息可利用程度上,而评价体系中的情感化指标如趣味性、启发性、文笔优美程度等在不同相似度的机器新闻样本中均未表现出显著差异,可见机器新闻在这些方面与人工新闻尚有一定差距。最后,本文也从研究中总结了四点机器新闻的改进方向以供参考。
其他文献
《富饶的西沙群岛》在多个版本的语文教材中都有出现。本文以人教版三年级上册中的课文为例。题目是文章的眼睛,《富饶的西沙群岛》从题目来看是围绕“富饶”来写的,但实际是除
城市导向标志系统不仅为人们出行提供便利,也是城市文明和现代化程度的一个重要展现。科学、完善的城市导向系统能够在现有硬件设施的基础之上,最大限度地缩短人们寻路所需时间
【摘要】小學阅读教学过程中的批注教学,往往流于形式,过于肤浅,缺乏精准指导。批注是重要的阅读手段,是深度阅读的重要凭借。小学阅读教学过程中的批注实践,不仅是阅读展开的需要,也是批注方法的习得,更是语文核心能力培养的重要途径。批注应成为各年段小学生课堂阅读的经常性阅读方法,应针对不同年级、课型、教学任务、教学内容和教学目标来倡导批注式教学。  【关键词】小学语文 核心能力 批注式教学  《义务教育语
小学语文单元整体观下的习作教学是一个“整合—分散—联动”的过程。首先,通过整合单元信息,确定整体习作目标,在教学中分解并落实具体的写作训练要求;其次,在分散练笔中,对接单元
要突破“阅读与写作孤立地教学,学生缺少表达技巧方面的训练”这一困境,教师就要在阅读教学中观照习作教学,巧用文本资源,把握文体特点,从单元课文的整体感知入手,关注教材的
变点分析是一类重要的统计问题,根据在变点处的变化形式的不同,可分为突变变点和渐变变点问题.在气象学、水文学等领域中,一些气象要素的分布存在长相依性,并且会从某一时刻