基于深度学习的多学科多层次学术论文结构功能识别方法比较研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:liongliong417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]学术论文的结构功能是学术论文篇章结构和语义内容的集中体现,目前针对学术论文结构功能的研究主要集中在对学术论文不同层次的识别以及从学科差异性视角探讨模型算法的适用性两方面,缺少模型、学科、层次之间内在联系的比较研究.[方法/过程]选择中医学、图书情报、计算机、环境科学、植物学等学科中文权威刊物发表的学术论文作为实验语料集,在引入CNN、LSTM、BERT等深度学习模型的基础上,分别从句子、段落、章节内容等层次对学术论文进行结构功能识别.[结果/结论]实验结果表明,BERT模型对于不同学科学术论文以及学术论文的不同层次的结构功能识别效果最优,各个模型对于不同学科学术论文篇章内容层次的识别效果均最优,中医学较之其他学科的学术论文结构功能识别效果最优.此外,利用混淆矩阵给出不同学科学术论文结构功能误识的具体情形并分析了误识原因.[创新/局限]本文研究为学术论文结构功能识别研究提供了第一手的实证资料.
其他文献
[目的/意义]基于机器学习算法对信息进行聚类及预测引起了广泛关注,本文将以航空公司客户信息为对象构建出k-means,BP神经网络模型,对航空用户进行聚类及预测,实现用户的精准营销.[方法/过程]首先,对航空公司的客户信息进行预处理,并根据信息聚类和信息预测理论,构建出k-means客户聚类模型与BP神经网络的流失预测模型.[结果/结论]实证结果表明,在聚类模型上,k-means算法将客户聚为五类,实现了不同价值客户的差异化识别;在客户预测模型上,BP神经网络的准确性更高.[创新/局限]本次研究将LRFM
[目的/意义]论文作者数与被引频次关系问题是个传统问题,研究结论一直存在争议,本文试图结束这种讨论.[方法/过程]在对作者数与被引频次关系进行理论分析的基础上,提出作者数影响因子的概念,以2019-2020版CSSCI经济学期刊为例,基于中国知网引文数据库,综合采用回归分析、分位数回归、单因素方差分析进行研究.[结果/结论]科研合作并不意味着作者数越多论文影响力越大;被引频次与论文作者数无关,不同作者数的作者数影响因子有显著差异,前者从微观视角考察,后者从宏观视角考察,两者并不矛盾;关于被引频次与作者数关
[目的/意义]利用用户画像以及个性化推荐算法实现智慧图书馆中的图书推荐.[方法/过程]从构建智慧图书馆用户画像的自然属性、兴趣属性、社交属性三个数据维度出发,借助相似度计算方法分别计算不同维度读者和图书的相似度,实现基于相似读者和相似图书的虚拟图书推荐,阐述了借助智慧图书馆的先进技术实现基于位置的实体图书推荐.[结果/结论]实验结果表明将用户画像用于智慧图书馆图书推荐可提升图书馆个性化服务能力,针对读者实现精准推荐.[创新/局限]基于用户画像的图书推荐从多个维度进行组合推荐,实现了智慧图书馆虚拟图书和实体
[目的/意义]疫情防控与人民群众的切身利益息息相关,研究新型疫情防控情报系统,利用区块链技术联合全社会力量共同抗疫,对提高疫情防控效率有重要意义.[方法/过程]首先分析了新型冠状病毒疫情防控工作中的不足之处,介绍了区块链技术分布式存储、不可篡改性、可追溯性等特点,研究了区块链技术应用于疫情防控情报系统的可行性,然后基于区块链技术构建了一个疫情防控情报系统模型,阐述了该模型的体系结构、总体架构、运作机制及保障机制.[结果/结论]该模型具有共享能力强、可拓展性强、安全性高等优势,有助于提高疫情防控效率.[创新
[目的/意义]随着网络信息技术的发展及国家对技术转移的政策支持,大量的在线技术交易需求产生.在线技术转移服务平台作为技术供需交易的媒介,供需双方可以在平台上发布大量的技术供需文本信息,提高技术供需文本匹配效率,有助于提高技术交易成功率,促进技术转移.[方法/过程]在分析传统文本匹配方法的基础上,从基于关键词的匹配方法、基于句法分析和文本结构的匹配方法、基于深度学习的匹配方法和基于多维度视角的匹配方法四个方向对目前在线技术供需文本匹配方法现状进行梳理.[结果/结论]大多数研究都融合了多种匹配方法,从多维度视
[目的/意义]针对当前中小企业情报收集系统模型收集情报的准确性、信息检索查全率以及情报分类管理效率较低的问题,提出基于LDA及模糊VIKOR法的中小企业情报收集系统模型构建.[方法/过程]根据LDA模型设计并构建中小企业情报收集系统模型架构,通过企业管理架构采集知识资源,将获取的知识分别划分至管理架构相应模块中,实现企业知识整合管理.根据模糊VIKOR法设计了中小企业情报分类步骤,引入贝叶斯统计的标 准法,获取最佳主题数量,采用Gibbs抽样算法得出分类隐含层主题集合概率整体分布的向量,实现中小企业情报收
[目的/意义]为了掌握国际情报学研究发展趋势,推动我国情报学的研究和学科发展.[方法/过程]采集了ASIS&T会议2002-2019年的论文数据,综合运用统计分析、社会网络分析、人工研读分析等手段,对国际情报学研究发展趋势和中国情报学研究特色进行分析.[结果/结论]中国情报学正积极融入国际学界,但不同机构的国际化发展水平仍不均衡;近18年国际情报学研究经历了“数字化”“社会化”“数据化”三个发展阶段,“数据”和“用户”是当前国际情报学研究的重要方向;中国情报学注重信息技术和计量方法的研究与应用,在未来发展
[目的/意义]古代藏书楼的管理思想可为新文科背景下图书馆学学科建设以及中国特色图书馆管理思想体系建设提供历史镜鉴.[方法/过程]采用史论结合的方法,对清代官府藏书楼管理实践及其历史背景进行深入分析.[结果/结论]从载体、内容、价值、制度结构四个维度挖掘和发现清代官府藏书楼之“文以载道、寓藏于修、统筹规划、明分任职、以文治国、培育贤才、按法治众、广为传布”的管理思想,为探寻中国特色图书馆管理思想源流及精神脉络提供参考.[创新/局限]在史料整理基础上对官府藏书楼蕴含的管理思想进行分析和梳理,使一个历史时期的图
[目的/意义]探讨网络问答社区中意见领袖的社会与知识分享行为特征,为问答社区的发展提供改进建议.[方法/过程]以知乎“旅行”问答话题下活跃用户为研究对象,通过python爬取用户的个人信息,利用数理统计和社会网络分析对意见领袖的社会及知识分享行为特征展开研究.[结果/结论]研究发现,社会特征是意见领袖开展知识共享活动的先决条件,网络问答社区的发展离不开社区用户的多元化;意见领袖为问答社区内容生成主力,知识分享行为广泛分布于意见领袖的信息活动中且其行为影响力突出;中心团体联合促进意见领袖间的知识分享,领袖群
[目的/意义]人工智能时代下,个人信息安全面临着越来越多的风险和挑战,研究个人信息的保护问题具有重要的理论意义和实践价值.[方法/过程]在分析人工智能时代个人信息安全问题的现实发展与理论内涵的基础上,对个人信息保护法律规制的缺陷、个人信息知情同意原则的困境、个人信息安全面临的技术性风险、人工智能企业的内部安全威胁与人工智能技术衍生的伦理风险进行检视,结合国际国内个人信息安全治理的理论与经验,提出人工智能时代个人信息保护问题的安全治理策略.[结果/结论]通过分析研究,提出完善人工智能时代个人信息安全的法律规