基于改进的TFIDF和压缩自动编码器文本分类研究

来源 :齐鲁工业大学学报:自然科学版 | 被引量 : 0次 | 上传用户:yfzzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高文本分类的分类效果和降低分类的错误率,本文将深度学习中的压缩自动编码器逐层叠加,提出基于改进的TFIDF和堆叠的压缩自动编码器SCAE(Stack Contractive Auto-Encoder)的文本分类思想,将SCAE构成深度神经网络,无监督的训练学习文本,提高特征提取的鲁棒性,并使用反向传播算法优化网络中的参数,在计算特征词的权重时,采用本文改进的TFIDF方法。通过实验将CAE和SAE(稀疏自动编码器)进行比较,采用支持向量机(SVM)分类。实验表明,单层的CAE比单层的SAE的分类性能
其他文献