【摘 要】
:
文本自动分类是指在给定的分类体系下,根据文本内容自动确定文本所属类别。文本分类技术的出现,使文档可以自动地按照类别组织和处理,符合人类组织和处理信息的方式。同时,作
论文部分内容阅读
文本自动分类是指在给定的分类体系下,根据文本内容自动确定文本所属类别。文本分类技术的出现,使文档可以自动地按照类别组织和处理,符合人类组织和处理信息的方式。同时,作为信息过滤、信息检索、搜索引擎等领域的技术基础,文本分类技术有着广泛的应用前景。学报和学术会议所使用的论文投稿系统,涉及上千篇投稿论文要分配给上百位评审专家去审阅,在很短的时间内人工分配这些投稿论文给相关学科领域的专家们去评审往往匹配的不好。特别是评审专家的研究领域不清楚,人工无法及时、准确的收集到评审专家所属的学科领域信息,影响到论文分配任务的正常进行。选择合适的评审专家是正确评价投稿论文质量和提升学报、期刊学术层次的关键,如何用计算机来实现自动分配投稿论文给匹配领域的评审专家去审阅?文本自动分类可以很好的解决这个问题。论文针对上述问题,提出一种基于文本分类技术的评审专家自动推荐模型,通过文本分类技术对投稿论文和对评审专家所发表的论文进行所属学科领域的分类,进而判断出评审专家的主要研究领域和投稿论文的学科领域。然后将投稿论文的学科领域与评审专家的研究领域自动匹配,建立自动推荐评审专家模型。论文的主要研究内容如下:①在特征筛选中,引入最大频率的概念和特征项与类别的相关系数D ( mik),提出了改进的χ2算法,实验结果表明,在特征项筛选中表现出了良好的筛选效果。②针对评审专家自动推荐模型选取的特征项为论文的关键词,在文本向量表示方法的基础上作了简化,提出了基于TF/IDF特征权重阈值的向量空间模型算法,并选用SVM分类方法对特征矩阵分类。实验结果表明,该算法可以有效的滤除不相关的噪声特征,产生更为准确的分类模型。③针对主动学习SVM分类算法在多类别的分类问题上存在分类器的速度随数目增加而变慢的问题,引入有向无环图SVM,改进了主动学习SVM分类算法,实验结果表明,改进后主动学习SVM分类算法可以增加交互的过程使训练得到的分类器具备自学习的能力,改进后主动学习SVM分类器在多类别的分类上能够精确分类并且提高分类速度。
其他文献
为了保证工件的产品质量,尤其是那些与交通安全直接相关的零部件的安全,如铁道货车摇枕、侧架,车轮,道叉等,必须对工件内部的缺陷进行严格的质量检测及等级评定。射线检测技术以其
无人水下航行器(Unmanned Underwater Vehicle,UUV)以其成本低、智能化程度高等优点在海洋开发等方面发挥着越来越重要的作用,其中航路规划是实现无人水下航行器自主航行的一项关
在较长的时间里,人们主要集中于对单个机器人的研究。随着时代的发展,对机器人的要求越来越高,以至于单个机器人难以满足新的需求。因此,一些学者提出采用多个功能相对简单和独立
脑电信号处理系统是临床检查脑疾病的重要辅助工具,它的好坏体现在系统能否有效提取脑电信号的各种特征信息。目前国内生产的脑电图仪对使用环境要求,测试数据精度低,抗干扰能力
提高产品质量、保证生产安全一直是现代工业追求的目标,如何对产品质量实时预测、实施过程监测,及时有效的修复故障,成为现在研究的热点之一。随着计算机等相关技术的发展,工业过程可获得大量甚至冗余的数据,这些数据蕴含着与生产过程运行状态及最终产品质量密切相关的信息,若能充分利用这些数据将具有非常重要的意义。本文以多变量统计方法为理论,提出了基于窗口均值OPLS的质量预测、过程监测及异常变量追溯方法,并将其
为了实现源网荷互动的电力系统功率平衡控制,提出了一种电网多智能体建模、仿真与控制方案。该方案仿真平台由NETLOGO与MATLAB组成,其中NETLOGO承担电力系统智能元件建模以及电网多智能体控制的工作,MATLAB负责电力系统的各项运算,通过NETLOGO和MATLAB之间的接口模块实现整个系统网络数据交互。仿真方案中电力元件智能体(Agents)与MATLAB通过接口传递交互信息,电力元件智
通过三维激光扫描仪可以在不接触物体的情况下,精确并快速获得描述样品表面信息的点云数据,利用这些点云的集合可以在计算机上进行三维重建工作。但是扫描只能得到当前视角下
指针式仪表自动识别技术是实现各种指针式仪表自动检定重要的基础和关键所在。在所查阅到的指针式仪表自动校验识别的相关资料中,对单表盘的指针式仪表校验的探讨较多,相应的问
直流电机由于具有响应迅速、精度和效率高、调速范围宽、负载能力强、控制性能优良等特点,被广泛应用于各类伺服控制系统中。同时,随着微电子技术和电力电子技术的发展及新型