论文部分内容阅读
网络飞速发展的今天,上网这一行为已经融入到了每一个人的生活之中,从笨重的台式机到如今轻便小巧的智能手机,我们每一刻都在使用着网络,网络的普及让电子购物变得异常容易,用户可以随时浏览到全世界的商品,看到自己满意的商品就可以随时购买。但是面对众多的商品数量,用户很难在其中找到自己感兴趣的物品,于是推荐系统应运而生,推荐系统会根据用户的行为特性来计算出用户的数学建模,从而找到用户可能感兴趣的物品推荐给用户。随着互联网的普及和迅速发展,上网用户的数量今年呈现出了指数增长的趋势,随之而来的问题是网络信息的爆炸性增加,这标志着网络的发展进入了大数据时代,面对海量的数据如何在其中找到最有价值的数据是目前最核心的问题。传统的推荐系统在面对海量的数据处理请求时已经无法做到及时准确的处理,因此在当前大数据背景下在海量数据中找到目标商品并推送给用户是推荐系统的发展方向。虽然学术界目前对其已经取得了一些研究成果,但推荐内容与目标用户失配的情况依然大量存在,如何有效提高推送服务中推送内容与目标用户匹配的准确度和高效性成了一个迫切需要解决的问题。本文对当前推荐系统进行了深入研究,对其中的主要推荐算法进行了细致的分析,指出了当前推荐算法的效率和准确性方面的问题,提出在推荐系统中加入基于网页内容的聚合优化方案。本方案将推荐算法的重点放在了页面内容的分类,相比于传统的基于用户和物品的分类大大降低了计算量,并且在系统中加入了Hadoop大数据处理技术,使得推荐系统能够并发处理海量的数据请求,从而提升了推荐系统的准确性和处理能力。最后,论文设计并实现了推荐系统的关键模块,并选取某电商前年的部分网络日志作为数据源,以推荐系统准确率、召回率、覆盖率作为评价指标,分别对优化前后的推荐结果进行对比分析,最后得出优化后的三个评价指标在一定程度上都有相应提高,最终验证了论文提出的优化方法对提高推荐系统的准确度和处理能力有所帮助。