A Short Text Classification Algorithm Based on Semantic Extension

来源 :电子学报(英文) | 被引量 : 0次 | 上传用户:flyfox521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
A semantic-extension-based algorithm for short texts is proposed, by involving the Word2vec and the LDA model, to improve the performance of classification, which is frequently deteriorated by semantic dependencies and scarcity of features. For every keyword within a short text, weighted synonyms and related words can be generated by the Word2Vec and LDA model, respectively, and subsequently be inserted to extend the short text to a reasonable length. We not only have established a criterion by means of similarity estimation to determine whether a sentence should be extended, we designed a scheme to choose the number of extended words. The extended text will be classified. Experimental results show that, the classification performance of the proposed algorithm, in terms of the precision rate, is approximately 5% higher than that of the TF-IDF model and approximately 10%higher than that of the VSM method.
其他文献
  研究了不同日粮蛋白质水平和肌肉纤维类型对肥育猪IMF含量及其脂肪酸组成的影响试验选取36头DLY阉公猪(体重为47±4.2kg),随机分为3个处理,每个处理12个重复,每个重复1头猪,
会议
随着网络及通信技术的迅速发展及移动设备(如智能手机)的普及,移动学习以其移动终端的便利性和随时随地可阅读等优势受到越来越多用户的青睐,已成为当今大学生普遍感兴趣的学
  将玉米黄浆液、喷浆玉米纤维、酱糟、木薯渣等低质食品加工副产物,添加适当辅料,经多种益生菌发酵后得到微生态发酵饲料,本试验旨在探讨该发酵饲料代替产蛋鸡日粮对其生产性
会议
  本试验探究冷季补饲精料对怀孕牦牛繁殖性能、生长牦牛生长性能的影响。试验一选用6岁左右、健康无病的经产怀孕牦牛10头,随机分为两组(5头/组),即对照组(全放牧)和精料组(
会议
  采用两因素3×3完全交叉设计研究了不同添加量的苹果酸(0.008、0.028和0.048g)和酵母培养物(0.05、0.08和0.11g)的组合物对模拟建立体外亚急性瘤胃酸中毒(SARA)条件下对
会议
  文中用实例演示根据猪饲养标准、饲料原料营养成分、饲料价格等,利用Excel表设计最低成本猪配合饲料配方。
  为摸清蚕沙在肉兔饲养中的饲用价值,为动物饲料合理开发利用提供科学依据,选取12只3月龄体重相近、健康的新西兰兔(公、母各半),随机分成2组,对照组饲喂基础日粮,蚕沙组饲喂80
会议
基于北京市开展水利工程运行管理标准化建设背景,按照标准化建设标准和考核标准等文件要求,以大宁调蓄水库标准化管理建设为例,总结水库标准化建设现状,从管理理念、技术标准
“易评易测”是一种辅助学生互阅试卷的盲评系统,系统加密答卷人和阅卷人个人信息,学生交叉阅卷时根据教师讲解的试卷及评分标准“盲评”,个人考试总评成绩由答卷和阅卷两部
在经历过疫情期间大规模的线上教学后,笔者对国内42所“双一流”高校图书馆提供的电子教参服务进行调研分析.总结了国内高校电子教参系统建设的三种类型及存在的问题,提出未