文本作者身份识别研究综述

来源 :图书情报工作 | 被引量 : 0次 | 上传用户：jewelryt40b

【摘要】

：

[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的

【作者】

：

祁瑞华霍跃红胡润波

【机构】

：

大连外国语大学计算机教研部,大连外国语大学英语学院,中国大连高级经理学院,

【出处】

：

图书情报工作

【发表日期】

：

2015年16期

【关键词】

：

身份识别文体特征作者身份建模性能评价指标

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。 [Purpose / Significance] In view of the traditional method of author identification does not apply to the current mass network text. This paper summarizes the typical methods and key problems of text author identification in recent years, and carries out objective analysis and evaluation with a view to providing new ideas for further research. [Methods / Processes] Objectively analyze the status quo of the research on identification of authors both at home and abroad from the aspects of application field, selection of stylistic features, author identity modeling and performance evaluation index, combing the development context and trend of related fields. [Result / Conclusion] Authorship identification needs multi-level features that need to be more expressive and descriptive, as well as appropriate author identity modeling methods that adapt to short texts, nonstandard texts, massively, highdimensional and multilingual environments, Recent research in machine learning and natural language processing improves efficiency and accuracy.

其他文献

探索转换时代中弱小民族的逻辑——韩国思想家李泳禧1970年代的中国研究

李泳禧,1929年出生于韩国平安北道云山郡(现朝鲜境内),2010年在首尔去世.他是韩国现代史上里程碑式的人物,也是一名颇具争议的人物.他一生著述颇丰,其中最具影响力的是《转换

序

本文通过对荣华二采区10

期刊

军队院校联合参考咨询学科专家激励机制研究——以波特-劳勒激励模型为分析框架

[目的/意义]化解军队院校联合参考咨询工作中学科专家的激励调动难题,实现深度的军事学科服务。[方法/过程]选用波特-劳勒激励模型为分析框架,从模型变量出发,抽象凝练出八大

期刊

联合参考咨询学科专家学科服务激励机制波特-劳勒模型军队院校

我国档案职业的构成与发展策略研究

档案职业作为社会职业构成中的组成部分,是在社会劳动分工基础上,以满足一定个体和社会需要为目的而形成的、具有特定技能要求的社会劳动形态之一。重视和研究我国档案职业的

学位

档案职业档案职业构成因素分析发展趋势策略研究

浅谈素质教育中的体育教学研究

摘要本文主要阐述了素质教育对培养新型人才的重要性，同时也说明了体育教学在学生成长乃至对以后生活的重要性，然后进一步说明了实行素质教育后，我在平时的体育教学中的一些体会与实践。　　关键词素质教育；体育教学　　所谓“素质教育”按《决定》表述：“就是全面贯彻党的教育方针。以提高国民素质为根本宗旨，以培养有理想、有文化、有道德、有纪律的，德、智、体、美等全面发展的社会主义事业建设者和接班人”。从这段文字可

期刊

素质教育体育教学

科学论文的科学计量分析:数据、方法与用途的整合框架

[目的/意义]学科体系内部的知识发展以及信息技术的突破与应用,使得科学计量学的数据对象日益充盈丰富。在科学计量学呈现出迅猛发展态势的情况下,辨析科学计量学的数据对象,

期刊

科学计量学发文数据引用数据使用数据替代计量数据共被引分析耦合分析

高被引论文与“睡美人”论文引用曲线及影响因素研究

[目的/意义]通过对潜在“睡美人”论文的引用分布分析,提炼其特征,以期为“睡美人”论文的预判研究提供思路。[方法 /过程]采用引用曲线这一更为直观的反映论文引用分布的方

期刊

引用曲线高被引论文睡美人论文天文学和天体物理

Spatial-temporal patterns of vegetation dynamics and their relationships to climate variations in Qi

本文通过对荣华二采区10

期刊

Qinghai Lake Basin EVI precipitation temperature correlation analysis

中文叙词表的语义化转换

[目的/意义]随着语义网与关联数据的兴起与发展,采用SKOS语言对叙词表进行语义化描述成为主流,这为叙词表在网络上的发布、共享以及在网络环境下的应用提供新的契机。[方法 /

期刊

SKOS语义化表示SKOS词表验证叙词表关联数据

基于本体的国史知识检索平台构建研究

[目的/意义]构建国史知识检索平台,提高用户获取国史知识的效率,促进国史宣传和教育。[方法/过程]提出基于本体的国史知识检索平台构建思路与总体框架,在构建国史本体知识库

期刊

本体实体检索查询问答关联检索可视化

文本作者身份识别研究综述

其他学术论文