文本作者身份识别研究综述

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:jewelryt40b
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。 [Purpose / Significance] In view of the traditional method of author identification does not apply to the current mass network text. This paper summarizes the typical methods and key problems of text author identification in recent years, and carries out objective analysis and evaluation with a view to providing new ideas for further research. [Methods / Processes] Objectively analyze the status quo of the research on identification of authors both at home and abroad from the aspects of application field, selection of stylistic features, author identity modeling and performance evaluation index, combing the development context and trend of related fields. [Result / Conclusion] Authorship identification needs multi-level features that need to be more expressive and descriptive, as well as appropriate author identity modeling methods that adapt to short texts, nonstandard texts, massively, highdimensional and multilingual environments, Recent research in machine learning and natural language processing improves efficiency and accuracy.
其他文献
本文通过对荣华二采区10
期刊
档案职业作为社会职业构成中的组成部分,是在社会劳动分工基础上,以满足一定个体和社会需要为目的而形成的、具有特定技能要求的社会劳动形态之一。重视和研究我国档案职业的
摘要本文主要阐述了素质教育对培养新型人才的重要性,同时也说明了体育教学在学生成长乃至对以后生活的重要性,然后进一步说明了实行素质教育后,我在平时的体育教学中的一些体会与实践。  关键词素质教育;体育教学  所谓“素质教育”按《决定》表述:“就是全面贯彻党的教育方针。以提高国民素质为根本宗旨,以培养有理想、有文化、有道德、有纪律的,德、智、体、美等全面发展的社会主义事业建设者和接班人”。从这段文字可
[目的/意义]学科体系内部的知识发展以及信息技术的突破与应用,使得科学计量学的数据对象日益充盈丰富。在科学计量学呈现出迅猛发展态势的情况下,辨析科学计量学的数据对象,