【摘 要】
:
在推荐系统领域中,针对数据集稀疏性问题的研究大都建立在静态数据集的基础上,而实际工业应用中的数据集则往往是动态的并且具有以下两个明显的特征:1)User-Item矩阵维度逐渐
【机 构】
:
桂林电子科技大学广西可信软件重点实验室 桂林541004
论文部分内容阅读
在推荐系统领域中,针对数据集稀疏性问题的研究大都建立在静态数据集的基础上,而实际工业应用中的数据集则往往是动态的并且具有以下两个明显的特征:1)User-Item矩阵维度逐渐增大;2)稀疏程度不断增加.因此,传统的依赖固定稀疏程度数据集的推荐算法的准确率则会随着数据集稀疏度的增加而下降.基于以上考虑,针对稀疏度动态变化的工业数据集的特征,提出一种准确率高而且对数据集稀疏程度敏感性较低的方法。该方法结合了少量的标签信息并利用了因子分析的方法,通过建立一种特殊的因子模型从而为用户构建一个新的User-Factor向量(用户一因子向量),并基于新的User-Factor向量为目标用户进行"邻居发现"和评分预测.最后,通过大量对比实验证明了本文中的方法在处理工业应用中的数据集时算法总是能够保持较高且稳定的准确率。
其他文献
随着物联网、云计算等技术的不断发展,产生的数据也以爆炸式的速度不断增长,如何在大数据中进行挖掘和分析成为了当前学术界研究的热点Hadoop分布式计算也因此逐渐成为了大数
ITU-TSG15(传送网、系统和设备)于1998年10月12日~23日在瑞士日内瓦ITU总部召开了(1997~2000年)研究期第3次会议。参加会议的有来自30个国家的23个电信主管部门、26个认可的电信运营
在Hadoop系统中,大规模数据分析应用程序的数据本地性是影响其性能的关键因素.传统的Hadoop系统是部署在物理机中的,目前针对传统Hadoop系统提高数据本地性的资源调度方法在
特征融合是提高三维模型检索有效性的一种重要手段,越来越受到广泛关注.为解决融合特征权重的自适应问题,提出了一种基于信息熵加权的三维模型多特征融合算法,以提升检索效果
探讨S100A6蛋白对细胞中β-catenin水平的影响及可能机制。用表达S100A6及其siRNA的重组腺病毒AdS100A6和AdsiS100A6处理人骨肉瘤细胞系143B,Western blot分析处理前后细胞中
在大数据处理系统中,系统对数据处理效率、安全、稳定性有非常高的要求.为了满足对大数据实时、高效、稳定处理的需求,文章提出了一种接收与处理分离的数据处理模型,数据处理
使匈奴中郎将在东汉皇朝与匈奴族关系史中,是一个颇为重要的问题。但是,目前尚缺乏系统全面的探讨,本文欲述一管之见,就教于方家。 (一) 使匈奴中郎将是因东汉皇朝与匈奴关
为了弥补从大数据技术到行业应用之间的鸿沟,针对当前行业用户对大数据处理平台的持续扩展、一体化和多样性需求,提出了大数据一体机的可扩展性、可定制性和多类型处理模型,
传感器的广泛应用产生了大量的不确定数据流,在聚类应用中,当输入数据为连续型随机变量时,现有基于离散型随机变量的聚类方法无法满足数据流应用在效率和精度上的要求.本文使
本文介绍“衰减”的基本概念,影响“衰减”测量的重要因素,“衰减”测量值与系统反射系数的关系,最后介绍了常用的克服失配与泄漏的方法。
This article introduces the basic