【摘 要】
:
越来越多的开发者已经倾向于购买各种Web服务搭建他们的应用平台。而面对市面上相关产品众多,功能高度同质化的现状,服务提供商有必要通过技术手段帮助用户确定其最合适的Web服务。因此,服务推荐技术应运而生,成为解决以上问题的有效手段之一。然而,作为服务推荐依据的QoS数据常含有缺失部分,QoS数据缺失过多会严重影响服务推荐的质量,因而数据科学家有必要在进行推荐之前对QoS数据中的缺失值进行预测并填充。
论文部分内容阅读
越来越多的开发者已经倾向于购买各种Web服务搭建他们的应用平台。而面对市面上相关产品众多,功能高度同质化的现状,服务提供商有必要通过技术手段帮助用户确定其最合适的Web服务。因此,服务推荐技术应运而生,成为解决以上问题的有效手段之一。然而,作为服务推荐依据的QoS数据常含有缺失部分,QoS数据缺失过多会严重影响服务推荐的质量,因而数据科学家有必要在进行推荐之前对QoS数据中的缺失值进行预测并填充。本文针对服务推荐中的QoS缺失值预测问题,采用张量方法完成了以下三个方面的工作:首先,针对传统张量模型不重视QoS数据位置信息的问题,本文将蕴含着位置信息的QoS数据进行聚类,将地理位置相近的服务聚合在一起,从而形成数个小型的QoS张量,以便于使用张量模型对它们分别进行缺失值预测,从而提高预测的准确度。其次,本文对QoS缺失值预测的求解方式进行改进,一方面考虑最小化缺失QoS张量中已知部分和预测结果中相应位置的误差;另一方面受到图像降噪问题的启发,将插补过后的QoS张量视作含有噪声的数据,然后对其进行去噪操作。本文随后在对QoS信息进行位置聚类的基础上,将这两种求解思路和改进后的高阶正交迭代算法结合起来,提出了 CHOOI1和CHOOI2两个QoS缺失值预测模型。在公开数据集WSDREAM dataset 2上验证了它们的可行性以及预测结果的准确性。为了进一步提高模型预测准确度,本文还将CHOOI2模型和传统张量模型中表现最为优秀的NTF模型相结合,提出了 QTF模型。实验证明,QTF模型在QoS缺失值预测任务上表现出了分别优于前二者的预测准确度和运行时间。第三,针对高阶正交迭代占用内存空间大、迭代慢的特点,本文从迭代过程出发,进一步完成了 QTF模型的并行化工作,并在Apache Spark分布式计算框架下实现,本文针对QTF的并行化工作主要集中在其CHOOI2模型部分。从实验结果来看,并行版本的算法相较于串行版本而言在运行时间上有一定程度的改善,而且有更大的潜力处理大规模数据集上的QoS预测任务。
其他文献
实践当中,公司及其投资者通过法律规避私下建立新交易模式的现象具有一定普遍性。面对这些规避行为,立法机关不应采取一概否定的态度,而是需要从交易成本、社会成本以及法律
运用定点突变技术研究重组荞麦胰蛋白酶抑制剂(rBTI)的作用位点,先后构建了R45A-aBTI和R45F-fBTI两个突变体.抑制活性测定显示,aBTI和fBTI均丧失了胰蛋白酶抑制活性,却分别增
当前,互联网技术已对课堂教学产生巨大影响和变革。针对高等学校的自身特点,文章提出一种基于互联网线上辅助教学模式的高校课堂教学改革方法,并对该互联网线上辅助教学的组
2013年我国《公司法》的修订虽然有利于投资创业,但也增加了债权人利益受到损害的风险。未出资股东对公司债权人的补充赔偿责任可以较好保护债权人利益,但需要作重新解释。未
针对矿难发生后井下环境的不确定性,提出一种以矿难前的GIS(Geographic information system)地图为基础建立环境栅格模型并结合改进遗传算法的矿难搜索机器人全局路径规划方法
胶片,即一种用于摄影、摄像的感光材料。在今天我们沉浸在方便、准确的数码记录时代时,不应该忘记曾经的影像记录媒介——胶片,它在给我们留下过一个时代的美好记忆。胶片留
目的比较不同药敏试验方法检测替加环素对耐碳青霉烯肺炎克雷伯菌(CRKP)的敏感性。初步了解辽宁地区CRKP对替加环素的耐药情况,为临床合理用药提供依据。方法回顾性收集辽宁
<正>刑事诉讼对案件事实的认定过程,既不是现场表演,也不是科学发现。因为,刑事案件的亲历者只能是被告人、被害人与目击证人,事实裁判者则是案件的非亲历者,而刑事诉讼过程
<正> 英帝国主义从土著黑人手中夺取了澳大利亚,并建立起各英属殖民区。到1900年时,在澳大利亚,已有六个各自为政的殖民区,即新南威尔士、维多利亚、昆士兰、南澳大利亚、西
在我国绝大多数商品的生产者、经营者以及服务的提供者都没有注册属于自己的商标,而且在这些数目众多的非注册商标里面也不乏一些比较知名甚至驰名的品牌,一些企业对未注册商