面向个性化Web新闻服务的层次型用户兴趣建模研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:luo665
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,Web信息呈爆炸式增长,在海量的数据中,如何快捷高效的搜索获取需要或者感兴趣的信息逐渐成为人们关注的焦点。Web个性化服务在一定程度上解决了信息高速增长与用户获取信息手段相对简单之间的矛盾。Web信息服务商通过不断提高个性化服务质量来更好地为吸引用户,获取用户的认同感,提高用户的满意度。用户兴趣建模是个性化服务的核心和关键,信息检索、数据挖掘、电子商务以及个性化推荐领域都试图考虑使用用户兴趣模型来提高信息服务的质量。传统的用户兴趣模型大都基于VSM(Vector Space Model,向量空间模型),使用关键词来表示用户的兴趣,既没有考虑关键词之间的粒度层次关系,也没有利用领域知识来推断用户感兴趣的具体概念或者主题,使得用户兴趣模型难以准确合理的表示用户的兴趣。针对传统建模方法存在的问题,本文以个性化Web新闻服务为例,对层次型用户兴趣建模展开研究,提出了一种基于图划分的中文词语层次聚类算法GCPHC(Graph Partition-based Chinese Phrases Hierarchical ClusteringAlgorithm),将用户的兴趣组织为树形层次结构,并基于HowNet和ODP领域知识,给出最大匹配映射算法HNM3(HowNet-based Maximum MatchingMapping)来定位用户的兴趣主题,最终构建带有主题标签的层次用户兴趣模型。本文主要工作如下:(1)在日益需要更加智能化的Web个性化服务的背景下,本文使用分裂式层次聚类算法对用户感兴趣的Web内容构建了层次型用户兴趣模型,为Web个性化服务提供帮助。(2)针对识别用户兴趣模型中具体兴趣主题的问题,文本使用HowNet知识库和ODP开放分类目录,将层次模型节点映射到ODP目录主题上,提高了用户模型的有效性。(3)通过相关实验,确定了构建用户模型过程中所需要的相关函数,数据规模和词性特征,为层次型用户兴趣模型在Web个性化服务领域的应用提供了依据。
其他文献
近年来自然灾害频发,灾难所带来的危害严重影响到人民的生命和财产安全,引起了全社会的广泛关注。RoboCup救援仿真系统通过计算机模拟现实中的城市灾难场景,通过仿真机器人来完
本课题系国家科技重大专项项目"TD-SCDMA行业信息化应用方案开发与产业化”。随着3G技术的不断成熟,3G视频应用变得越来越广泛。但是由于无线网络的开放性,给信息安全以及内
近年来有不少学者对图像配准技术进行研究,并提出了一系列相关算法。其中ASIFT算法被证明是具有完全的仿射不变性的图像配准算法。相对于经典的尺度不变的SIFT算法,ASIFT算法
随着计算机及网络技术的快速发展,对重要而敏感信息的保护受到高度的关注。门限签名是现代密码学的重要分支,在保证数据的完整性、私有性等方面有着极其重要的作用。门限签名可
胎儿心电(Fetal Electrocardiogram:FECG)中包含着大量的生理信息,能够直观的反应围产期胎儿的生长发育和健康状况,达到对疾病及时发现、及时治疗的目的。目前FECG的主要检测
流形学习方法的研究逐渐成为了机器学习领域里的一个重要分支。针对图像特征流形的问题,本文提出了图像特征流形的谱估计学习框架,包括:(1)分析了图像流形拓扑不变性的相关谱
随着计算机技术的不断发展,软件测试渐渐成为一项耗费大量资源的活动,因此人们一直在研究使用何种方法来降低软件测试的成本。经验及实践表明,组合测试是一种实际而有效的测
互联网迅速膨胀所带来信息大爆炸使得现代搜索引擎正面临前所未有的性能挑战,每天约有数百亿条用户查询请求需要处理。作为搜索引擎处理用户查询的核心功能――倒排索引交集求
目标跟踪系统是一种典型的非线性、非高斯随机系统,而且在这一系统中存在的系统状态及参数估计等问题历来是该领域研究的难点与热点。为此,本文探讨了一种基于粒子滤波算法对机
流形学习方法是近年来深受人们关注的学习方法之一。本文以流形中或者流形间切丛上的仿射联络算子为出发点,提出了仿射联络算法。本文主要取得的成绩包括:(1)提出了基于张量数