论文部分内容阅读
“大数据”时代给各种网络环境下的信息内容服务带来了新的机遇与挑战,一方面海量信息资源丰富了服务内容,提供了更全面的数据支撑;另一方面从海量数据中挖掘出满足不同用户需求的有价值资源将更加困难,并且由于海量数据的超高维、稀疏性、价值密度低等特点,加剧了“信息过载”问题对用户接受信息内容服务的影响。上下文感知推荐系统作为缓解上述问题的核心支撑技术之一,近年来在学术界与工业界受到了广泛关注与深入研究。但是在其支撑数据、推荐算法等核心部分的研究仍存不足,具体表现在支撑数据的不准确性、稀疏性影响了偏好模型的准确度,推荐算法对于用户决策的影响因素研究不足影响了推荐质量等。那么研究建立能够解决上述问题的上下文感知推荐系统,将能够有力的促进“大数据”环境下信息内容服务的发展,具有重要的研究意义与实际价值。本文针对上下文感知推荐系统的支撑数据、核心算法等提出了新的优化策略与实现方法,所解决的问题主要包括:如何修正用户历史偏好数据中的伪偏好行为;如何解决历史偏好数据的稀疏性问题;在此基础上,如何从多视图角度建立用户的偏好模型;如何进一步的将用户认知行为融入偏好模型的建立过程;如何引入群集认知行为优化偏好模型等。具体的解决方案如下:(1)针对用户历史偏好行为中存在的不符合其偏好模型的行为记录,影响偏好获取准确率的问题,提出了一种基于决策欺骗自适应修正模型的上下文感知偏好获取方法。该方法首先采用同类中心点距离分离出用户历史行为中的伪偏好行为,将上下文行为波动与上下文偏好波动进行交叉验证,并结合模糊隶属函数将伪偏好行为关联至模糊决策欺骗类,最后分别引入不同的行为补偿策略,以逐步提取更为精确的用户偏好。实验结果表明,所提出方法优于经典的协同过滤算法及上下文感知推荐算法,说明其能够有效的缓解伪偏好行为对于推荐质量的影响。(2)针对现有情景推荐系统所采用的行为相似度度量方法,受数据稀疏性的影响难以获取用户真正的偏好最近邻问题,提出了一种结合基准相似空间分布优化的用户偏好获取方法。首先通过偏好行为度量策略获取用户间初始的偏好行为近似程度,根据近似程度的分布特征获取偏好中心点,并基于偏好行为近似程度距偏好中心点的行为距离获取平均相似幅度,进而生成基准相似空间,通过建立基于平均近邻与异常评分交互影响的修正模型,优化基准相似空间并生成推荐结果。仿真实验结果表明,相比于现有方法,能够在大规模稀疏数据集上获取到更加准确的最近邻用户,并显著的提高了推荐准确度,验证了所提出方法能够有效的缓解数据稀疏性问题。(3)针对现有的情景推荐方法仅从单视图角度为用户生成推荐服务所导致的推荐精度低、适用性差等问题,提出了一种基于多视图相似关系融合的上下文感知推荐方法,首先基于直接相似性与间接相似性获取用户与用户间的相似关系,再利用概念相似性算法获取用户与项目间的相似关系,然后基于线性判别分析对上述两种视图数据进行特征融合,通过投影变换并引入线性判别准则,获取具有最大类间离散度,最小类内离散度的投影方向,也即是具有最优推荐效果的投影方向。实验结果表明,相比于现有方法,能够更加准确的挖掘用户偏好间的关联关系,进一步提高了推荐质量。(4)为挖掘在各类型上下文环境中的认知行为与用户偏好间的内在联系,提出了一种基于用户认知行为的上下文感知偏好获取方法。在多维上下文环境下,将认知水平、认知风险、有效认知行为等认知概念引入偏好获取过程,并分别给出其概念定义及计算方法,通过建立多种认知因素交互影响的偏好获取模型,分别提取在单维与多维上下文环境下的用户偏好。在大规模真实数据集上的实验结果表明,偏好获取质量优于基于行为的上下文感知推荐方法,说明该方法能够有效的挖掘用户认知行为与其偏好间的关联关系,同时也验证了从认知层面建立用户偏好模型的可行性与有效性。(5)为挖掘在社会化网络环境下用户认知心理与其偏好行为间的内在联系,受分布式认知模型及多视图学习理论启发,提出了一种基于多视图群集认知优化的上下文感知推荐方法,基于社交关系网络与个体认知行为,从社会化认知的角度获取用户认知行为间的关联关系,建立了包含认知依赖、认知风险、群集认知等因素的认知关系网络模型,并从用户属性、认知关系、项目认知价值等视图出发,通过特征融合、投影变换并引入Fisher判别准则,建立基于多视图优化的偏好获取模型。在大规模真实数据集上的实验结果显示,相比于现有方法推荐准确率平均提升了 20.19%,多样性提高近44.89%。在验证所提出方法有效性的同时,也说明了用户的认知行为会受到相关用户群组的影响,并且基于真实社交环境的群集认知模型,相比于仅从用户层面度量其认知行为,能够更加准确的反映出用户的认知状态。