论文部分内容阅读
随着互联网与信息技术的迅速发展,我们进入了信息过量且愈发碎片化的时代。面对海量的网络信息,用户很难找到对其有用的信息,而信息发布者同样很难将自己发布的信息呈现在对它感兴趣的用户面前。为了缓解上述问题,个性化信息推荐系统应运而生。然而,面对信息的更新速度快、用户兴趣的不固定以及用户属性与用户权限的不断细分,传统的个性化信息推荐算法往往很少关注甚至忽略上述因素,造成最终的推荐结果欠佳。为了给用户更好的个性化信息推荐服务,上述出现的问题为论文的研究重点。本文的主要工作为: 1.对用户模型的构成过程进行研究。本文在基于内容的推荐算法中引入截取因子,用户模型仅仅由用户最新浏览的部分信息生成,缓解了系统为用户推荐其过去可能喜欢但当前不关注的信息的问题。 2.对相似度计算的过程进行研究。本文在基于内容相似的协同过滤与基于行为相似的协同过滤中通过引入截取因子获取目标用户的最新浏览信息,然后与其它用户浏览的所有信息进行相似度计算,进而找出用户的相似邻居集。 3.对推荐结果生成的过程进行研究。本文提出了一种新颖的组合推荐算法——CR算法,该算法推荐结果由两部分组成:混合推荐方法和基于用户的协同过滤方法。这样只需过滤出信息发表时间与当前时间的差值小于某一阈值的信息,将这部分信息利用混合推荐方法推荐(对于那些信息发表时间与当前小时差值不小于上述阈值的信息,若其符合推荐条件则已经由基于用户的协同过滤推荐了)。 4.对用户权限以及信息属性的不断细化问题进行研究。本文设计了一种同时兼顾信息属性与用户权限的IR算法。该算法首先利用改进的决策树算法对服务器上的信息集进行分类,然后分析服务器上各类信息子集与角色之间的关系,紧接着服务器与角色之间的信息传送,最后,分析并解决角色到用户之间的信息传送。 5.本文对CR算法与IR算法分别进行了实验验证。实验结果展示CR算法与同类算法相比,在F值、精确度、回召率以及多样性方面有巨大优势。在信息分类方面,IR算法中的改进ID3算法与传统的分类算法相比,其在准确度以及对用户现实需求反映更佳。在信息传输方面,通过设计实验验证可靠率方面比较理想。