基于内容关联的在线商品推荐系统研究与优化

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xialin1983922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,信息逐渐增多,数据量呈现指数级增长,由此引发了大数据时代的到来。在这种环境下,信息过载问题随之而来,人们获取有效信息的难度也因信息过载问题的愈发凸显而急剧提升。如何解决信息过载问题也逐渐成为一个研究热点,推荐系统就是一个解决问题的有力办法。推荐系统能够根据项目信息或者用户信息,通过一定的匹配计算和相似度计算,对众多的目标用户没有接触的项目进行评分预测,通过排序、过滤,提取评分最高的Top-N项目作为推荐结果反馈给用户。在当前的推荐系统的研究领域,主要研究的推荐算法有三种:基于内容推荐算法、协同过滤推荐算法、混合推荐算法。针对在线商品而言,现有的这三种推荐算法的推荐依据基本都以各种文本内容为主,比如商品描述、评分信息、用户信息等内容,但是除了上述文本内容之外,商品信息还有其他表现形式,如商品类别属性、商品图像信息等。此外,用户对在线商品的关注点也更多地从文本描述转为视觉图像特征,因此,商品的图像等视觉效果对用户的影响也是不容小觑的。针对上述问题,本文在研究商品推荐时,将商品的内容信息分为商品文本内容、类别属性、图像特征三种,根据商品的内容分类,引入基于文本内容的推荐算法和基于类别属性的推荐算法,提出基于图像特征的推荐算法。在基于文本内容的推荐算法中,本文主要通过提取文本信息,使用TF-IDF和余弦相似度来进行商品匹配和推荐,在基于类别属性的推荐算法中,本文通过构建属性矩阵来完成属性相似度的计算过程,在基于图像特征的推荐算法中,本文提取图像SIFT特征作为图像匹配标准,改进了基于p-stable distribution的LSH算法,实现了高维度下大量图像的搜索匹配,并通过实验证明了改进的LSH算法对召回率和错误率都有一定的优化,通过匹配耗时和Hash表长度可知该算法优化了内存利用和搜索匹配效率。根据上述三种推荐算法,本文通过权重拟合策略将其进行有效融合,提出CI-LSH算法——基于内容关联的在线商品推荐算法,建立相应的推荐模型,并进行实验验证,由基于CI-LSH算法的推荐模型的平均绝对误差MAE和精确度Precision得知,本文提出的CI-LSH推荐算法提高了推荐结果的精准度和可靠性。最后本文构建出在线商品推荐系统的整体架构,对系统架构、工作流程和各个模块进行了相应的研究和阐述。本文研究不管是在理论创新还是实际应用上都有一定的意义,增加了商品推荐时的推荐依据,同时改善了现有推荐算法的推荐效率和推荐准确性。
其他文献
近年来,随着我国经济飞速发展,经济发展与环境保护之间的矛盾日益凸显,为了协调这种矛盾,我国在公共服务和民生保障工程尤其是环境保护基础设施项目方面持续加大投入,财政部
在管道水力计算过程中,不同材质的管道粗糙度不同,对局部阻力产生的影响也不同。本文介绍了一种修正局部阻力的计算方法,对工程中的计算具有较强的参考价值。
目的:探讨对外伤性颈椎骨折患者进行整体护理的临床效果。方法:将2015年1月至2017年3月期间江苏省宜兴市人民医院收治的40例外伤性颈椎骨折患者作为研究对象。将这40例患者随机
当代中国城市化进程持续发展,尤其是改革开放以后,相对和平的国内和国际环境为城市化进程的加快提供了必不可少的条件。然而,机遇与挑战并存,发展与问题同行,随着城市的发展,
近年来,随着社会的发展,混凝土结构朝着安全性更高、质量更稳定、耐久性更强的方向发展,由水泥基复和而成的普通混凝土已经不能满足越来越高的工程质量要求,新型超高韧性水泥基复合材料愈发引起人们的重视。超高韧性水泥基复合材料(Engineered Cementitious Composites,简称ECC)是一种功能型纤维增强水泥基复合材料,它一般以水泥、粉煤灰等胶凝材料和细骨料作为基体,同时掺入体积掺量
对现在普遍应用的极大似然估计定位方法进行了分析,发现极大似然估计法参考方程(第n个方程)的锚节点(参照锚节点)测距误差和参照锚节点在定位区域内的位置对定位误差有重要影响:参