【摘 要】
:
针对协同过滤算法在海量数据环境个性化推荐应用中存在的低效率问题,本文结合MapReduce 框架特点,设计了一种应用于个性化推荐的基于位置编码的索引树(Location Bitcode
论文部分内容阅读
针对协同过滤算法在海量数据环境个性化推荐应用中存在的低效率问题,本文结合MapReduce 框架特点,设计了一种应用于个性化推荐的基于位置编码的索引树(Location Bitcode Tree,简称LB-Tree),创新性的将索引结构应用于个性化推荐。利用聚类资源的差异性存储策略,提升MapReduce任务处理并行性;根据聚类数据分布特征,以质心为圆心对聚类中的数据对象进行同心圆分层,并对每层采用不同长度的二进制编码来表达,将所有数据对象的编码组织成索引树结构,缩短频繁推荐的数据查找路径,达到个性化推荐时利用索引结构快速确定搜索空间目的。实验证明,本方法具有较高的推荐准确率和运行效率。
其他文献
为有效识别与管理机会,依据认知信息加工论,参照认知活动的过程特性,认知情境模型和注意的信息过滤器机制,本文提出了由私有视图获取、私有场景构造、场景融合、场景泛化与场
随着需要处理数据集的规模越来越大、时效性要求越来越高,对聚类算法的性能和大数据适应能力提出了更高的要求。模糊C均值聚类(FCM)是一种重要的柔性聚类技术,在多个领域
本文在对世界石油资源、北疆原油资源、北疆稠油性质分析及稠油加工形势进行大量调研的基础上,对北疆稠油利用现状、存在问题、克拉玛依石化公司稠油集中加工的优势进行了详
Presentations during this conference will demonstrate that we are beginning to understand how to control fruit ripening,manipulate fruit quality,and add,mod
目前我国正在大力推行"一带一路"航海战略,航海事业蓬勃发展,大量新码头正在修建中。如何快速、准确更新码头的空间信息,对于分析进出口贸易、提高码头服务效率等具有很强的
水稻稻曲病是由稻绿核菌引起的水稻穗部病害。近年来,随着高产杂交水稻的大面积种植以及高产栽培技术的推广,水稻稻曲病已由水稻次生病害上升为主要病害。认知稻曲病流行规律,对
针对支持向量机在分类决策过程中会因为支持向量的暴露而导致隐私信息的泄漏,提出了一种基于信息浓缩的隐私保护分类方法IC-SVM(Information Concentration Support Vecto
本文针对炼油厂延迟焦化装置的焦化炉进行了红外监测,通过测量炉管外壁温度,来判断其内壁结焦情况和炉膛温度场分布规律,及时进行烧焦(除焦)和调整火咀火焰,提高其加热效率,
随着大数据时代的来临,对联机分析处理(OLAP)提出了更高的性能要求。针对传统OLAP处理大数据时实时响应能力差的问题,探讨基于分布式内存计算框架Spark加速立方体计算,设计
本文以上海石油化工股份有限公司涤纶事业部PTA装置的对二甲苯(PX)氧化反应工艺为研究对象,围绕对二甲苯氧化工艺(三井工艺)进行实验研究,考察了反应温度、催化剂浓度、催化