论文部分内容阅读
推荐系统在各大在线服务中具有广泛的应用场景,它的作用在于基于用户的兴趣为其推荐相匹配的项目,提升用户体验的同时也为系统带来更多的收益,实现用户与系统的双赢。基于深度学习的推荐算法是一个热门的研究方向,这些方法将特征映射为低维度的隐向量,但它们无法精准的衡量隐向量之间的相似关系。推荐系统中的信息之间存在关联关系,依据这些关系可以构建出图网络。采用网络表示学习方法可以提取图中的非结构化信息,丰富特征隐向量的表达。一些推荐场景下中存在文本信息,有效的利用诸如文本类别、情感等辅助信息可以提升推荐性能。复杂推荐系统存在多领域的文本信息,存在域适应的问题,这为辅助信息的提取带来了困难。
针对以上问题,分别从基于深度因子分解机的推荐算法,基于异构图的推荐算法以及推荐场景下的远域文本分类三个方面进行了研究。具体工作如下:
(1)基于深度因子分解机的推荐算法。提出了一种基于“宽深”结构的推荐模型,深度神经因子分解机(Deep Neural Factorization Machine)DNFM,可以精准的学习特征相似关系与全局非线性信息。“宽”部分为基于FM的改进模型,维度加权因子分解机(Dimension-weighted Factorization Machine)DwFM,DwFM改进了特征相似度计算方法,为不同的交叉领域学习不同的权重向量,可以更精准的度量特征相似性。“深”部分为一个神经网络,它可以捕获数据的高阶非线性信息,该部分提高了模型的泛化能力。
(2)基于异构图的推荐算法。提出了一种基于异构图嵌入的推荐模型,个性化出行预测(Personalized Taxi Demand Prediction)TDP,为用户推荐其感兴趣的起点与终点对。首先基于区域的共现信息以及时间属性信息构建多个异构图,联合多个异构图求得区域的向量化表示。再采用向量化召回技术得到用户感兴趣的起点与终点集合。最后使用基于深度神经网络的排序模型得到用户感兴趣的TopK起点与终点对。
(3)推荐场景下的远域文本分类。提出了基于选择迭代的模型,选择域适应算法(Selective Domain Adaption Algorithm)SDAA,为推荐提供好的多源信息辅助。文本是推荐应用的一个重要辅助信息,其存在远域适应的问题。SDAA迭代的从源域与中间域中基于类别与结构相似性选择有意义的数据,进而与目标域进行知识迁移,并采用流形损失来控制迭代优化的过程。
针对以上问题,分别从基于深度因子分解机的推荐算法,基于异构图的推荐算法以及推荐场景下的远域文本分类三个方面进行了研究。具体工作如下:
(1)基于深度因子分解机的推荐算法。提出了一种基于“宽深”结构的推荐模型,深度神经因子分解机(Deep Neural Factorization Machine)DNFM,可以精准的学习特征相似关系与全局非线性信息。“宽”部分为基于FM的改进模型,维度加权因子分解机(Dimension-weighted Factorization Machine)DwFM,DwFM改进了特征相似度计算方法,为不同的交叉领域学习不同的权重向量,可以更精准的度量特征相似性。“深”部分为一个神经网络,它可以捕获数据的高阶非线性信息,该部分提高了模型的泛化能力。
(2)基于异构图的推荐算法。提出了一种基于异构图嵌入的推荐模型,个性化出行预测(Personalized Taxi Demand Prediction)TDP,为用户推荐其感兴趣的起点与终点对。首先基于区域的共现信息以及时间属性信息构建多个异构图,联合多个异构图求得区域的向量化表示。再采用向量化召回技术得到用户感兴趣的起点与终点集合。最后使用基于深度神经网络的排序模型得到用户感兴趣的TopK起点与终点对。
(3)推荐场景下的远域文本分类。提出了基于选择迭代的模型,选择域适应算法(Selective Domain Adaption Algorithm)SDAA,为推荐提供好的多源信息辅助。文本是推荐应用的一个重要辅助信息,其存在远域适应的问题。SDAA迭代的从源域与中间域中基于类别与结构相似性选择有意义的数据,进而与目标域进行知识迁移,并采用流形损失来控制迭代优化的过程。