论文部分内容阅读
如今,人工智能已经渗透到人们生活的方方面面,关于人工智能即将取代人类的言论不绝于耳,在这样的时代背景下,新闻业也迎来了自己的人工智能应用—机器新闻。它的出现同样掀起了其将来是否会替代新闻记者的热烈讨论。美国机器写作公司Narrative Science的技术负责人Hammond曾预言未来15年内,90%的新闻将由计算机撰写。对于机器新闻是否会替代记者的问题,当前研究中的评判大多来自研究者的主观思考,缺乏客观角度的量化研究。本文认为考察机器新闻是否替代记者,首先应当认识到机器新闻多大程度上可以达到记者的写作水平,这类问题涉及到计算机与人类的相似性,属于人机交互中计算机拟人化研究领域,该领域存在著名假设:人机交互系统中计算机的拟人化程度越高,人类对计算机的评价越好。基于以上假设,本文提出了自己的基本假设:机器新闻与人工新闻的相似性与受众对机器新闻内容评价之间存在相关性。本文借用自然语言处理中文本相似度的概念来描述两者的相似性。而对于内容质量的测评,本文借鉴了已有的机器新闻内容质量评价体系。研究样本方面,本文收集了腾讯Dreamwriter在2016里约奥运中的一系列金牌报道,以及国内其他三大门户网站—网易、新浪、搜狐的人工新闻报道作为样本库。本文在这些样本中,选取文本相似度差异较大的5篇机器新闻,与5篇同类人工新闻一并接受双盲测评,采用调查问卷的形式基于评价体系对机器新闻与人工新闻的内容质量进行测评。通过一系列的数据分析,结果验证了本文提出的所有假设,认为机器新闻与人工新闻的相似度与其内容质量存在正相关。在相似度差异的背后,本文也探索了导致相似度差异的影响因素,发现这些因素主要集中在客观层面,如客观性、清晰度、以及信息可利用程度上,而评价体系中的情感化指标如趣味性、启发性、文笔优美程度等在不同相似度的机器新闻样本中均未表现出显著差异,可见机器新闻在这些方面与人工新闻尚有一定差距。最后,本文也从研究中总结了四点机器新闻的改进方向以供参考。