【摘 要】
:
随着信息技术的高速发展,网上信息资源越来越丰富,出现了所谓的“信息过载”和“信息迷向”问题,即人们很难找到自己感兴趣的信息。数据挖掘和协作过滤正是应这种需要而产生
论文部分内容阅读
随着信息技术的高速发展,网上信息资源越来越丰富,出现了所谓的“信息过载”和“信息迷向”问题,即人们很难找到自己感兴趣的信息。数据挖掘和协作过滤正是应这种需要而产生的。数据挖掘是在大量数据中找到规律,发现有用信息;协作过滤,它通过分析用户兴趣,在用户群中找到指定用户的兴趣相似用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度的预测。推荐系统是网站用来向顾客提供产品信息和建议,也是数据挖掘和协作过滤现实中的很好的应用方面。
在研读了大量的数据挖掘和推荐系统方面的资料后,本文将实现两种推荐算法,能够当用户登录时,按照对以往此用户的日志记录挖掘的规律,首先给用户推荐他感兴趣的信息。本研究所做的主要工作:
1)使用隐式浏览输入,通过一定的数据抽取转化,作为数据挖掘的输入,一般用户的点击、浏览日志作为数据的主要来源,通过简单的用户行为来发现用户特性。相对以往的推荐算法一般都是针对显式浏览输入,要用户注册、评分来挖掘用户属性,这种方式将是以后数据挖掘的主要方向。
2)用户属性匹配技术,建立在数据挖掘的基础上,通过用户的行为,将用户浏览或点击的产品属性信息赋予给这个用户,再根据用户属性与产品属性的相似度,提供推荐。文章中提出并实现这一算法思想,这种方法的提出提供了推荐技术的一种新的思路,并对其进行评估,验证了其有效性。
3)基于聚类的协作过滤技术,将数据挖掘的聚类和最近邻居算法结合,共分为数据抽取、转换,聚类离线模块,推荐模块和数据库更新四个模块,通过聚类方法减少最近邻居的搜索范围,最后通过协作过滤技术进行预测评分,实现推荐。实验验证这种方法提高推荐的有效性及准确率。
其他文献
对于每个学生而言,高中阶段都是人生的重要阶段.新时期下,为了全面提升学生的身心综合素养,学生的体育能力被纳入了高考考核范围之内,因此,高中体育与健康课程就引起了广泛的
目的 了解北京市门头沟区2015—2016年分离的Victoria系乙型流感病毒血凝素HA1基因变异特征,分析流行株与我国疫苗株的匹配情况,为乙型流感防控提供依据。方法 对狗肾传代细胞(MDCK)培养分离得到的14株Victoria系乙型流感病毒进行核酸提取,采用逆转录-聚合酶链反应(RT-PCR)扩增病毒HA1基因后进行核苷酸序列测定,采用邻接法进行遗传进化树分析。结果2015—2016年北京市
中共中央政治局第三十八次集体学习,安排的内容是世界网络技术发展和我国网络文化建设与管理。中央外宣办网络宣传局李伍峰、信息产业部电信研究院教授级高级工程师曹淑敏就
文言文是高中语文教学的一项重要内容,但是文言文表达的内容与情感却与学生有着时间差,容易使学生产生困惑,从而失去学习兴趣.为了能够提高文言文教学有效性,语文教师必须摒
在网络安全中为了保证信息的安全,密码体制一直受到人们广泛的关注。本文从研究现有的分组密码、双线性映射、公钥密码体制等理论知识着手,重点研究了基于身份的加密体制,并且结
该文以不可跟踪的离线电子支付系统作为研究对象,致力于研究适合大规模应用的、高效的、安全的离线电子支付技术,设计和实现更接近于传统货币使用功能的离线电子支付系统,为
平时地理课堂教学中,多从学生密切的实际生活出发,设计联系学生实际生活的活动问题,让学生表演、交流、感受,合作探究,激发学生学习兴趣,调动学生学习的积极性,提高课堂效率.
CCSDS(空间数据系统咨询委员会)是一个由多国空间组织共同组成的国际性标准化组织,它主要为空间数据系统制定标准化的通信体系结构、通信协议与业务.该文对CCSDS标准中的几个
实践中,侵犯作品著作权案时有发生,很多案件是由于出版社或责任编辑对有关问题的不当理解造成的。本期专题采取以案说法和以事谈法的形式,即从一个案件谈相关的法律问题,并且
无线通信MIMO技术是分别在发送端和接收端采用多天线系统的先进通信技术,为解决无线接入所需的高容量和高速率的瓶颈问题提供了重要的解决方案。空时编码是一种基于MIMO架构的