一种新型的用户兴趣模型的构建与应用

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户：dukewyh

【摘要】

：

随着Internet的迅速发展，各种信息以指数级的速度增长，类型也越来越多。如何有效地解决信息过载和信息迷失带来的种种问题，如何满足各种用户不同的个性化需求等，是研究人员面临的

【作者】

：

左治勤

【机构】

：

中国地质大学(武汉)

【出处】

：

中国地质大学(武汉)

【发表日期】

：

2008年期

【关键词】

：

用户模型兴趣特征词 SVM文本分类兴趣更新

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet的迅速发展，各种信息以指数级的速度增长，类型也越来越多。如何有效地解决信息过载和信息迷失带来的种种问题，如何满足各种用户不同的个性化需求等，是研究人员面临的新课题，个性化服务已经成为当前信息服务领域的研究热点之一。个性化服务的目的是为了帮助人们从海量的信息集合中准确地获取自己所需要的信息。在过去的个性化服务研究中，研究者把研究的重心放在个性化服务的具体技术上，如推荐技术、信息检索技术、用户聚类技术等，而忽略了用户模型在个性化服务中的重要性。好的用户模型可以有效地捕捉用户变化着的兴趣。只有捕捉到用户兴趣才能有效地实现个性化服务。因此，有必要单独研究如何构建好的用户模型。在传统用户建模技术上，本文提出了一种新的用户兴趣动态更新模型，实验表明该模型能较好地捕捉到用户的真实兴趣。本文主要完成了以下几个方面的工作： ①本文提出一种新的兴趣特征词的权值计算方法。兴趣特征词的权值用来量化兴趣特征词对用户兴趣的影响程度，因此权值计算的准确度直接影响到文本分类的准确度，进而影响到用户兴趣描述的准确性。实验表明，采用新的权值计算方法，可使文本分类的准确度、召回率和F1值均提高了1到2个百分点。 ②在分析传统用户兴趣模型的基础上，提出了一种将用户浏览行为和浏览内容相结合的新的用户兴趣模型。首先根据用户浏览行为计算出用户浏览兴趣度，然后用构建好的多类SVM文本分类器进行分类。该模型既能避免仅用浏览行为来描述用户兴趣的片面性，又能够有效克服传统的基于内容的用户模型不能刻画用户行为特征的不足。 ③为了更好的实现用户模型的更新，除了对特征词典、兴趣特征词库更新外，本文在遗忘因子的基础上明确给出了新的长、短期兴趣更新的新算法，包括短期兴趣更新算法、短期兴趣向长期兴趣转化、长期兴趣更新算法。实验表明，该算法在很大程度上解决了长、短期兴趣识别和转化难的问题，能准确捕捉用户长、短期兴趣的变化。 ④采用www．sohu．com网站的标准分类页面作为实验语料，完成了以下实验：新的权值计算方法的性能检验实验、B-SVM文本分类性能检验实验、新的动态更新算法性能检验实验。结果表明，该模型能够准确地捕捉到用户兴趣和兴趣的变动。

其他文献

公共交通路面数据库管理系统设计与实现

自上个世纪八十年代以来，我国高速公路建设发展迅速，目前已经初步完成高速公路网的建设，随之而来的是大量的养护工作。在国外，路面管理系统已经被证明是一个统筹养护资金分配。维

学位

路面数据库关系数据库路面使用性能系统结构设计管理系统

BitTorrent协议数据调度技术研究

在今天的互联网上进行大规模的数据分发是一个常见的应用，传统的C/S架构对于这种应用来说，成本高昂，可扩展性差。近年来，出现了基于P2P的分发技术，它允许接受服务的客户端也共享它

学位

数据调度策略网络性能网络协议对等网络

代价敏感支持向量机及其应用

数据挖掘技术经过多年的发展，已经逐渐建立起系统的挖掘理论和成熟的挖掘技术。形成了以关联规则挖掘、分类规则挖掘、聚类规则挖掘为主要形式的，以数据库技术、统计学、人工智

学位

数据挖掘支持向量机代价敏感算法数据预测

电信网络资源管理系统设计及功能模块实现

随着国内电信运营竞争格局的形成和中国加入WTO，电信运营商需要更快、更好地满足市场需求，进一步提高经营和管理效率，降低企业运营成本，以获取更大的企业效益，这对电信企业的运营

学位

电信企业网络资源管理集约化管理管理系统网络数据共享数据库

MAPGIS-IMS7.1负载均衡与容错的研究与实现

WebGIS是Web技术和GIS技术相结合的产物，它在地理信息系统平台基础上嵌入HTTP和TCP/IP协议，实现互联网环境下的GIS服务共享功能。WebGIS因为其本身表现方式的优雅、多样性、便

学位

地理信息系统GIS服务MAPGIS-IMS7.1负载均衡器容错技术

基于Linux的TCP/IP分布式计算应用研究——黄石移动GSM话务系统计数模块实现

随着个人电脑的使用普及，越来越多的单位和家庭都拥有了不同数量的电脑设备和其他的产品。在日常的工作和生活中，大部分的个人电脑只是处理一般的文档操作和低强度的事务处理。

学位

分布式计算Linux操作系统多线程技术话务系统

基于局部特征变换的人脸识别方法

人脸识别技术就是利用计算机分析人脸图像，提取有效的特征信息来辨认身份或者判别待定状态的一门技术。它涉及模式识别、图像处理、计算机视觉等诸多学科的知识，是当前研究的热

学位

人脸识别图像处理特征提取人脸图像

融合触觉反馈的多通道交互模型研究

多通道交互是人机交互领域的重要研究方向，综合利用多个通道的信息能够提供更加自然、高效的交互体验。当前的触觉技术发展和可穿戴界面的交互特征给多通道交互的研究和应用设

学位

计算机技术多通道交互触觉反馈

园林信息管理模型的设计与实现

本文主要研究了对园林数据的存储组织、查询管理和统计分析。利用地理信息系统(GIS)技术、数据库技术设计开发出园林信息管理模型，实现对公园绿地、附属绿地、行道树、古树名

学位

地理信息系统数据库信息管理系统园林信息

EPDL语言继承的编译实现

随着越来越多的成功软件系统成为了遗产系统(legacy system)，软件演化的重要性和普及性越来越强。软件演化已成为软件生存周期中最重要的形态之一，进入了软件的各个领域，成为了

学位

软件系统遗产系统软件演化过程描述语言软件开发

一种新型的用户兴趣模型的构建与应用

其他学术论文