基于改进贝叶斯的时效性实体词挖掘

来源 :信息与电脑(理论版) | 被引量 : 0次 | 上传用户:ya4516623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了针对大规模查询日志进行时效性实体词挖掘技术,实体词挖掘在搜索引擎中应用广泛,而时效性实体词的识别,对于网络新增热门实体词的检索体验优化具有至关重要的作用。对此,本文通过query聚类、提取实体词上下文组成长文本的方式,提出了一种改进贝叶斯的分类算法进行时效性实体词的识别。实验结果证明本文方法在时效性实体词识别方面,达到了90%以上的准确率。 In this paper, we study the time-efficient entity word mining technology for large-scale query logs. Entity-word mining is widely used in search engines, and the recognition of time-sensitive entity words is crucial for the retrieval experience optimization of new hot entity words in the network effect. In this paper, this paper proposes a modified Bayesian classification algorithm to recognize time-sensitive entity words by means of query clustering and extracting the text of entity word context group. Experimental results show that the proposed method achieves over 90% accuracy in time-sensitive entity word recognition.
其他文献
我国是世界海水养殖产业大国,随着养殖品种的增多和养殖规模的扩大,病害已经成为水产养殖可持续发展的主要障碍。虹彩病毒肿大细胞病毒是水产养殖鱼类重要的病毒性病原。目前
为了从海洋生物中发现新的具有生物活性的先导化合物,分别选取了南海海草泰莱草(Thalassia testudinum)和南海柳珊瑚鳞海底柏(Melitodes squarnataNutting)两种海洋生物进行
主要通过对电动挖掘机全数字直流调速系统与串机组直流发电机励磁调速系统的对比,阐述了全数字直流调速系统的特点、以及满足电动挖掘机特性的技术要求和参数,并介绍了该系统
一、经纬仪检定数据处理系统结构设计通过研究经纬仪检定项目的特点及共性,笔者设计时将经纬仪检定数据处理系统分成4个子功能模块:垂直度检定模块、竖盘指标检定模块、标准
十年动乱,激化了党内及社会各方面人与人之间的矛盾,甚至家庭内也不太平,其影响之深远难以估计。 粉碎“四人帮’以后,我们党进行了拨乱反正,正本清源,在组织上采取了一系列的措施
南海是位于西北太平洋最大的半封闭海盆,在季风、ENSO(El Ni(n)o-Southem Oscillation)和IPO(Interdecadal Pacific Oscillation)等外强迫的影响下,南海上层热力状况呈现多时间
本文以近年来珠江口海洋工程泥沙污染、赤潮以及海上溢油等水环境应急事件的遥感监测为例,基于多源海洋光学卫星资料和现场实测数据,提出了新的适合珠江口Ⅱ类水体的悬浮泥沙、
Marinactinospora thermotolerans是中国科学院南海海洋研究所从中国南海北部海底3800米海泥样品中分离到的新属新种——诺卡式菌.本课题组从肥thermotolerans(代号为SCSIO00
潮汕坳陷是中生界地层为主的沉积坳陷,被认为是南海油气勘探的重要勘探领域。中海油与台湾中油公司合作在潮汕坳陷西北部斜坡带上钻的LF35-1-1探井钻遇了大套中生代地层和火
超微型光合生物(picophytoplankton或photosynthetic picoplankton)是指粒径为0.2-2μm(或3μm)的光合浮游植物,包括超微型光合真核藻类(photosynthetic picoeukaryotes,Euk)以及