基于最大边界相关度的抽取式文本摘要模型研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:wilson_rui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]为得到与原文相关度高、冗余度小的摘要,本文提出一种结合深度学习的无监督抽取式文本摘要模型.[方法/过程]在最大边界相关度(Maximal Marginal Relevance,MMR)模型的基础上,利用深度学习中的词嵌入与句嵌入的文本向量表示方法计算句子之间的相似度,并根据关键词与位置信息对句子重要性的影响对句子排序,得到高质量的摘要.将本文提出的模型应用到2018 Byte Cup生成文章标题任务的数据集上验证模型效果.[结果/结论]模型抽取单句摘要的Rouge-L值为28.24%,高于传统的抽取式文本摘要算法CI(17.37%)、Tex-tRank(22.70%)和MMR(23.52%);抽取多句摘要的Rouge-L值为37.78%,高于传统的抽取式文本摘要算法CI(29.35%)、TextRank(34.15%)和MMR(31.09%);结果表明深度学习有助于提升抽取式文本摘要的效果.[创新/局限]本文创新点在于将最大边界相关度(MMR)与深度学习相结合,综合考虑句子与全文相似度、关键词以及位置信息等特征以抽取摘要;局限在于研究范围仅为抽取式文本摘要,后续研究将尝试融合抽象式文本摘要模型.
其他文献
[目的/意义]馆藏文物资源知识分散、异构、关联程度较低,本文提出一种馆藏文物资源知识关联的有效方法,便于关联化的知识服务的开展和馆藏文物信息资源的开发利用.[方法/过程
[目的/意义]知识经济时代,知识的继承、聚合、管理和创新是各领域迫切需要解决的问题,知识融合作为知识工程、信息技术、管理科学、图书情报等领域的交叉学科,受到学者们的广
杨廷福、杨同甫编著的《明人室名别称字号索引》为研读明代文献、考索明代人物带来极大方便.但该书仍有可以完善之处,一是已收人物的字号别称有遗漏现象,二是一些重要人物的
【目的/意义】面对智慧城市日益突出的信息安全问题,构建智慧城市信息安全影响框架模型,探究影响因素之间的相互关系,为提高智慧城市信息安全风险应对能力,确保智慧城市系统平稳运行提供参考。【方法/过程】基于扎根理论,从半结构化访谈获得的访谈资料入手,通过开放式编码、主轴式编码、选择性编码和饱和度检验等几个阶段,利用NVivo12软件对智慧城市信息安全影响要素进行关系梳理,构建智慧城市信息安全影响框架模型
[目的/意义]从国家和地区层面研究科技论文空间分布与地区差距的时空演变,有利于总结其发展规律,对于优化科技资源的空间配置,缩小地区差距具有重要意义.[方法/过程]本文以图
纵观百年中国音乐创作中和声的运用,可以说是一条由中西多声思维碰撞与融汇而逐渐发展起来的"新的河流".其中最有特色的是,在借鉴西方和声理论与技法的同时,吸取我国民间音乐的多声思维与实践特点,而形成的中西多声思维的碰撞与融汇.百年中国音乐创作中后70年(新中国70年)可分为两个部分:前30年(20世纪50年代—70年代)在碰撞中追求风格与特点;后40年(20世纪80年代—本世纪10年代)在碰撞中趋向融汇与个性.论文分析了中西多声思维碰撞与融汇的原因和具体体现.
[目的/意义]以5G通信技术、多维技术以及数据仓库技术为依托,在智慧社会发展背景下,对智慧高校图书馆微服务模式框架进行设计与分析,以优化高校师生服务模式.[方法/过程]本文
格奥尔格·弗雷德里希·哈斯是当今国际乐坛炙手可热的作曲家,其创作多聚焦于"声音"本身,即在音响形态的变化过程中,力求以不同律制间的冲突碰撞和音高间的微分音差探索"声音"中丰富的可能性.论文以其代表作《置于虚空》(In Vain,2000)为研究对象,深入剖析其内部呈现出的律制对峙现象,力求以此获得其探究音响世界的手段,走近其特殊的创作视角.
[目的/意义]中国特色哲学社会科学体系的构建和发展,迫切需要更科学适用的学术成果评价标准发挥作用.[方法/过程]本文分析了哲学社会科学及其成果评价的基本规律,阐述了中国
新宾满族扭秧歌活动原存于正月"撵鬼"习俗.秧歌音乐包括唢呐曲牌、秧歌柳子、打击乐,分别主要具有连接功能、表白功能、震慑功能.但整个习俗之所以具有撵鬼祈福功能,主要缘于秧歌隐含着的一种特殊身份.从秧歌队的脸谱中可以看到这一身份隐喻的线索.实际上,秧歌经历了"着戏为傩"的过程,是傩的世俗化.当下,伴随着信仰式微、人类力量增强以及民俗神秘性消失,撵鬼习俗逐渐成了一种文化表演.随之,秧歌音乐的撵鬼功能逐渐弱化,被用来塑造满族的文化认同和乡民的文化自信.其文化融合反映了满汉两族的双向认同,为铸牢中华民族共同体意识奠