面向领域的推荐系统理论与关键技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:a83017396
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网信息的快速增长,用户面临着信息过载的问题。借助数据挖掘和人工智能领域中的相关技术,推荐系统能够帮助用户快速找到其感兴趣的信息,在社交网络、电子商务、在线阅读和广告投放等领域得到了广泛的应用。随着互联网应用的多元化发展,传统的推荐模型难以直接运用到新领域中以解决相应的问题。
  以智能手机,笔记本电脑等为代表的电子产品更新换代通常较为频繁,而用户对于此类产品的消费周期则相对较长。传统的推荐系统会根据用户之前的消费记录来进行推荐,这种情况下有些消费记录可能已经失去了时效性,无法提供足够的有效信息来推荐新项目。针对这一问题,本文决定从两个角度进行建模,即项目水平和用户水平。前者反映了项目的属性相对于同类竞品所处的档次,后者则反映了用户偏好的项目所处的档次。通过分析项目的属性变化趋势以及用户的消费行为特点,发现用户的偏好具有一定的稳定性,即用户在不同时期也会倾向于购买具有类似属性水平的项目。基于此,设计了两种新的相似性度量方法,然后利用它们来扩展隐特征模型得到两种新方法—基于项目水平相似度的矩阵分解算法(ILMF)和基于用户水平相似度的矩阵分解算法(ULMF)。此外还将这两种扩展方法结合起来,进一步研究这两种扩展方法对推荐结果的贡献程度。实验结果表明提出的方法在真实数据集上的表现优于对比方法。
  不同于传统的推荐任务,兴趣点推荐是指在特定时空背景下,预测目标用户感兴趣的地点。兴趣点推荐不仅能让用户获得更好的访问体验,还能让服务提供者根据用户的反馈信息进行改善。兴趣点推荐需要充分考虑用户的访问行为特征,而用户的访问行为受到地理、时间等因素的影响,同时还具有群体性特征。因此如何合理地将这些影响因素融入统一的兴趣点推荐框架中是一个巨大的挑战。为了解决这个问题,首次提出了一种基于分组的兴趣点推荐方法GTSAR-RNN,综合考虑了时间信息、评论信息、类别信息和地理信息。为了提高模型的针对性,根据访问数据将用户划分到不同的分组中,并为每组用户训练一个独立的神经网络来进行兴趣点推荐。GTSAR-RNN采用一种灵活的多分组策略将用户分到多个组中,每个组都会产生一个独立的推荐结果,而最终的推荐结果则是把不同分组的推荐结果进行整合。一个拥有多个兴趣倾向的用户会被分到多个分组中,由于对每个分组都进行独立训练,因此每个分组对应的神经网络都捕获了该用户的部分兴趣。采用这种独立训练的策略能够较好地兼顾推荐的个性化和多样性。实验结果表明GTSAR-RNN在真实数据集上的性能相较于对比方法有明显的提升。
  传统基于预测评分的推荐系统通过计算项目属性与用户偏好的匹配度,然后向用户推荐匹配度最高的Top-k个项目。然而这种Top-k推荐策略,主要是从用户的角度来进行个性化推荐。生产商和销售商则希望推荐系统能够快速发现项目的潜在客户,从而采取针对性的宣传营销手段,以促进项目的销售。为了寻找项目的潜在用户,决定将反向Top-k查询引入到推荐系统中。现有推荐模型处理的都是确定数据,然而在现实生活中,用户在挑选产品时并不总是遵从某种特定规则,可能存在一定的随机性。捕捉用户偏好是推荐系统的一项核心任务,而当前的研究只考虑了不同场景下用户偏好的变化,忽略了同一场景下用户偏好也不确定的情况。因此本文首先对用户的不确定偏好进行建模,然后提出一种不确定偏好下的反向Top-k查询。为了提高查询效率,设计了RUI-tree来对用户的不确定偏好数据进行索引,并在此基础上提出了UPBBR算法。实验表明UPBBR算法在生成数据集和真实数据集上均优于其他对比算法,且表现出良好的延展性。
其他文献
城市废水厂中的污泥含有很多有毒有害物质,如果不加以妥善处理,将造成严重的二次污染。热解作为常规的污泥资源化利用处理手段,其主要副产物为污泥热解炭,廉价而易得,具有广阔的应用前景。另一方面,燃煤工业和机动车向大气排放大量的NOx,不仅对环境造成破坏,并威胁人类的健康。然而,通过热解制备的热解炭中含有丰富的碳元素和优良的孔隙结构,既可作为还原剂也可作为催化剂载体,应用于脱硝反应中。因此,本文将以污泥热
学位
正丁醇是具有发展潜力的内燃机生物替代燃料。均质充量压缩着火(HCCI)方式是提升传统汽油机热效率的有效方案。将正丁醇应用于HCCI发动机是缓解能源供需紧张的重要措施。本文利用负气门重叠角策略,在单缸四冲程发动机上研究了平均指示有效压力(IMEP)≤0.3MPa,当量空燃比条件下正丁醇/乙醇-汽油HCCI发动机燃烧特性和排放规律,并研究了不同推迟着火时刻方式对正丁醇HCCI发动机燃烧特性的影响。此外
CO2捕集技术作为一种负碳排放技术,可以有效实现电厂等大型碳排放源的碳减排,进而应对全球变暖和气候变化。化学吸收法是发展最为成熟,且最接近商业化的碳捕集技术,但是较高的捕集能耗限制了其进一步发展与应用。本文从多个方面分析了提升化学吸收法碳捕集技术能效的方法,形成了“循环分析及优化—技术实现、验证及优化—系统集成及优化”的分析路径,从单个循环到实际系统再到多系统集成,逐步提升化学吸收法碳捕集技术能效
学位
微波光子技术结合了微波技术和光子技术的各自优势,有望解决传统雷达难以实现的宽带信号产生和处理问题。然而现有的微波光子系统大部分基于分立器件构建,存在着重量大、体积大、成本高、可靠性差、易受环境影响等问题,严重制约了微波光子技术在雷达系统的实际应用。微波光子系统集成化是解决上述问题的重要途径,也是现阶段微波光子技术的研究焦点。  本文以集成微波光子雷达为研究方向,围绕其中的滤波、延时、移相及系统验证
保障智能卡、射频识别、无线传感器网络等资源受限设备的信息安全,已成为密码学领域备受关注的科学问题。为能更好实现密码性能在安全与高效之间的有效兼顾,本文对基于动态轮数的混沌分组密码开展研究。主要研究内容说明如下:  针对有限运算精度造成混沌系统动力学特性退化,通过统计测试分析得出量化方法和参数设置对数字混沌特性的影响规律,采用级联和扰动的补偿方式构建动力学特性显著增强的数字混沌模型,从而更好满足混沌
学位
量子信息与量子计算领域中两个著名的研究成果——BB84密钥分配协议(Bennett-Brassard protocol proposed in 1984)和Shor的质因子分解算法——均对现有的密码体系产生了深远的影响。然而,更具广泛应用前景的Grover迭代算法在穷举搜索之外的密码学应用还未经充分研究。此外,另一类典型的量子迭代运算过程——量子随机行走——的非马尔科夫模式(或具有记忆的量子行走算
数据建模是机器学习和人工智能领域的重要研究问题,聚类分析可以有效地挖掘数据内在的模式和规律。复杂网络(图数据)作为新的研究热点,对理解社会复杂系统有着重要的作用,可以有效地用于推荐系统、恐怖组织挖掘等问题。近年来,网络结构的动态演变给社团检测建模提出了新的挑战,如何采用高效的学习模型挖掘动态复杂网络内在的规律,实现社团检测和演化分析,成为动态复杂网络研究的重点。从动态复杂网络中节点重要性、社团结构
语义分割旨在为图像中的每个像素分配一个预定义的语义类标签,使计算机能够通过视觉的方式对场景进行细粒度地理解。该技术被广泛应用于自动驾驶、城市规划、智能家居等任务中,是计算机视觉领域的重要分支。近年来,基于深度卷积神经网络的分割技术将任务性能提升到了一个新的水平。然而,现有的深度学习方法需要大量的像素级人工标注图像作为训练数据,使得这些方法所需的时间和金钱成本十分昂贵。为了减轻手工标注数据带来的沉重
学位
异构并行系统通常是指由中央处理器(Central Processing Unit,CPU)与图形处理器(Graphics Processing Unit,GPU)、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)等协处理器共同组成的计算方式异构的高性能计算系统,因能提供更为高效的应用加速能力而被广泛部署,在大数据、人工智能等众多关键领域得到了广泛应用。当
Android(安卓)操作系统占据了智能终端操作系统的大部分市场份额,搭载Android操作系统的智能设备成为主流。由于移动智能终端携带了较多的用户隐私信息,同时Android应用的安全机制存在一定的局限,导致Android应用可能存在严重的安全隐患。需要对Android应用的安全机制特别是权限机制进行深入的研究,分析Android应用中的权限安全风险。同时关注和研究Android应用的安全漏洞,
学位