选择集成窗口算法在时间序列预测中的应用研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:sure565372
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前集成学习是机器学习中研究的一大热点,在解决TSP问题中取得了很好效果。集成学习方法是通过综合多个模型的输出结果来达到更好的学习效果,但并不是所有学习器的效果都好,已有研究证明有选择性的集成部分效果较好的学习器要优于集成全部的学习器。选择集成技术利用不同学习器之间的差异性,通过组合性能较好的学习器来提高模型的泛化性能,并且不同学习器有其独有的特点,集成学习充分的发挥了其各自优势。因此,近年来选择集成技术被广泛的应用到许多领域,如医疗诊断、语音识别、股市预测、交通流预测等,在实际应用前景方面该研究具有很大的实际意义。基于选择性集成技术提高模型的性能,近年来许多学者在各个领域已经获得了不少的研究成果,但在构建一个强大的集成选择系统上,仍然可以有进一步改进的空间。如何训练出优质的学习器,以及对于这些学习器在不同的应用领域按照什么样的标准有选择性的构建一个高性能系统,将是衡量学习器的准确性以及学习器之间的差异性的两个重要因素。
  针对以上问题,本文首先在基学习器的训练阶段,为减少数据噪声对学习器的干扰,通过Bagging和随机子空间方法(RSM,RandomSubspaceMethod)扩大样本的多样性来训练多个支持向量机(SVM,SupportVectorMachine),提出了RSM-Bagging的结合策略,解决了数据集中的相关和冗余特征的问题;在单个学习器选择阶段,将差异度和准确性作为衡量标准,用熵来度量差异性,提出了差异度不减的选择策略,有利于模型的实时性和准确性;在集成阶段,对多个窗口的学习器进行集成,并在验证集上根据窗口中学习器的平均准确率给不同的窗口分配了不同的权重,解决了时间序列中窗口大小固定且难以确定的问题,增加了其模型的泛化性。最后,针对本文提出方法将该模型扩展到了篮球比赛预测和交通流预测上,并与现有的主要方法进行了比较,通过理论阐述以及实验效果证明了该模型在时间序列预测问题上取得不错的效果。
其他文献
近年来,机器学习在人工智能领域取得了巨大进展,但许多机器学习模型被构建为“黑盒”类型的模型,这种情况使用户很难去理解模型系统的内部逻辑。这种缺乏解释的情况既是一个实际问题,也是一个道德问题。模型可解释性在一些特定领域是有强烈需求的,尤其是在金融、医疗、反欺诈等领域。  模型可解释性的研究已经出现了一段时间,但目前对于机器学习的可解释性学习的研究,大部分研究存在于监督学习领域,尤其在近几年,深度神经
学位
随着Android智能手机越来越受大众的喜爱,Android恶意软件给用户带来的不良影响日益严重。为牟取利益而采取的恶意扣费、系统破坏、隐私窃取等恶意攻击手段层出不穷。如何有效的检测Android操作系统上的恶意软件是众多研究者所关注的一个研究重点。恶意软件分析技术主要包括静态分析和动态分析两类,考虑到时间效率等原因,本文基于静态分析来开展相关工作,提出了两种检测方案,并通过实验验证了它们的可行性
学位
音频场景分类(AcousticSceneClassification,ASC)问题主要是根据场景的音频记录来识别声音环境。这些声学场景可以根据特定的地理环境(如海滩、公园、道路等)、室内或室外场所(餐厅、办公室、家庭、市场、图书馆等)的特定社会情景以及特定的交通工具(汽车、公共汽车、电车等)来定义。声学场景的分析与识别,由于其简单方便,通过识别其所对应的特定场景语义标签,可以达到感知和理解周边环境
随着经济和互联网技术的飞速发展,推动者金融的互联网化,银行等金融机构也由此推出了多元化的借贷产品,给人们的生活带来了很大的便利。面对巨大的交易量和交易额,随之而来的就是欺诈风险的不断提升,所以对于加强风险控制,防范欺诈,建设一个健壮的金融风控系统,对于企业的长久发展是十分重要的。风险控制往往要根据市场的变化进行快速的更新迭代,传统风控系统传统金融风控系统中采用硬编码的方式来实现风控规则,存在着规则
工作流模式表达了工作流的基本结构特征,对工作流模式的支持是衡量工作流产品在过程表达能力和适用性方面的重要标准。目前的工作流产品对不少复杂的工作流模式尚不能很好的支持,尤其是缺乏对工作流模式进行形式化描述的方法。另一方面,工作流提倡业务逻辑与过程逻辑相分离的理念,但在实际的工作流系统中,与业务相关的过程逻辑却往往和程序代码混合在一起,难以分离,当业务发生变化时,工作流系统的重构工作就变得非常困难。 
学位
布尔函数是许多密码系统的核心部件,其密码学性质优劣决定着整个密码系统的安全性强弱。为了抵抗各种已知攻击,布尔函数需同时满足几条性质:平衡性,良好的(快速)代数免疫度,高非线性度和高代数次数等。旋转对称布尔函数是一类输出在输入的循环移位下保持不变的布尔函数,具有结构简单、运算速度快、易于实现等优点,在密码系统中应用广泛。择多逻辑函数是结构最简单的具有最优代数免疫度的布尔函数,其快速代数免疫度仍然是个
学位
近年来,云计算环境的安全问题研究已成为一个研究热点,访问控制技术是解决云安全问题的有效方式。本文在传统的RBAC模型基础上,设计一个基于身份认证和信任区间的云环境下访问控制模型。模型分为两个部分,第一个是会话部分,第二个是授权部分。第一部分通过ECC口令身份认证方案,实现用户和云服务器中角色的会话关系。第二部分利用信任区间的概念,实时考察角色行为的可信程度,从而为角色授予相应的权限。  目前云认证
学位
乳腺癌是最常被发现的癌症之一,它威胁到女性的健康和生命。早期准确的疾病诊断在癌症治疗中起着重要作用。临床研究表明,如果在早期阶段检测到癌症,它可以相对容易地治愈而不会对患者造成太大伤害。超声成像是检测乳腺癌的一种方法。医疗超声波使用人体无法听到的高频声波(>20,000Hz),将脉冲发送到人体组织中并以不同的属性反射回来被记录并显示为图像,是一种观察人体内肿瘤和其他异常等疾病的便捷工具。本文的主要
随着社交网络、自媒体平台和移动平台的快速发展,图像、文本、音频和视频等多模态数据进入爆炸式增长阶段。多模态数据高效、准确检索的需求日益增加,使得跨模态检索成为学术研究的前沿和热点。跨模态食谱检索是跨模态检索的研究范畴之一。近年来,跨模态检索在烹饪领域的应用因大量可用数据及深度学习的发展而引起广泛研究。跨模态食谱检索本质上属于跨模态学习问题。论文主要研究工作是基于跨模态图像文本检索的烹饪食谱与食物图
学位
随着科技的发展,交通拥堵引起了国内外广泛关注。为了有效的缓解交通拥堵,智能交通系统应运而生。在智能交通系统中,短期交通流预测是交通控制决策的关键。有效的交通控制和引导很大程度上依赖于实时短期交通流预测的准确性。提高短期交通流预测的准确性和实时性可以减轻交通问题的不利影响,促进交通路网的进一步优化设计,从而节省交通出行时间,节能减排,减少环境污染。本文在分析了大量短期交通流预测方法的基础上,针对目前
学位