论文部分内容阅读
网页分类存在着新词多、特征维数高的问题,提出了一种新的网页分类方法。首先利用桥本体对分类领域本体进行集成,建立多本体语义标注模型,对文本特征进行降维。在此基础上,对不同类标号的关健词进行聚类,解决新词无法识别的问题,同时考虑网页标签的不同权重,用改进的SVM模型对中文网页进行分类。实验结果表明,上述方’法改进了传统SVM分类器的性能。