Web检索查询意图分类技术综述

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:jsw10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询分类是近年来信息检索领域的研究热点,并且在很多领域得到了广泛地关注。主要讨论根据查询的意图进行分类的研究工作,从查询分类的诞生背景、关键技术、所使用的分类方法和评价方法方面进行综述评论,提出了查询意图分类面临的问题和挑战。认为缺乏权威的评测标准、在大规模数据集上的未经全面测试的性能、如何准确地获取查询的特征以及如何证明分类体系的完备性和独立性是目前查询意图分类研究的关键问题。
其他文献
苏东剧变以来,国内外政治界、学术界对苏共亡党、苏联解体的原因进行了多视角、多方法的探讨和研究,见仁见智,众说纷纭。中国外交部原部长李肇星“在外交部工作期间,曾利用各种时机向不下30位外国领导人请教过苏联解体的原因,得到的回答不少于30种,涉及上层腐败、信仰异化、言行不一、法制不健全、经济体制僵化、贫富悬殊、改革太急、与美争霸失利,等等。”经笔者梳理,大体上有以下主要观点。     “三大垄断”说
本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法。该方法首先按字抽取特征向量的属性得到训练集,采用多项式核函数建立SVM人名识别模型,然后在特征空间中计算测试样本到SVM最优超平面的距离,当该距离大于给定的阈值时使用SVM对测试样本进行分类,否则使用概率统计方法。实验表明,采用混合模型,对样本在空间的不同分布使用不同的方法可以取得比单独使用SVM或概率统计更好的分类效果