基于互信息规则剪枝的关联文本分类

来源 :南京师范大学学报:工程技术版 | 被引量 : 0次 | 上传用户:wuxinxinwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的关联文本分类算法产生的规则数量巨大,若不对规则剪枝会影响分类效率,而采用以前的剪枝方法又会使分类精度出现不同程度的下降.为此提出以互信息的方法对每个类的规则进行剪枝,挑选出分类能力强的规则构成分类器,对待分类文本进行分类.经过这个方法剪枝后的规则数量大幅减少,且能取得比规则集未修剪过的分类器和采用以前剪枝方法的ARC-BC算法更好的分类效果,大量的实验表明此方法是有效的.
其他文献
抚河水量支撑着抚河流域的用水安全,尤其是人口密集、工农业较为发达的抚河中下游流域。通过对水文资料以及其他资料的整理分析,当前抚河中下游流域的缺水干旱呈现以下情况:近
温排水研究是电厂排水环境影响评价和海域使用评估的重要前提。受排水量、排水结构设计及受纳水体动力条件等影响,温排水三维热力扩散特征较为复杂,规律性不强,是电厂温排水研究