基于Bandit反馈的分布式在线算法研究

来源 :重庆师范大学 | 被引量 : 0次 | 上传用户:jiangzhaomaomao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数据规模的增大及其高速流式产生方式的普及,分布式优化算法在理论和应用上都取得了很大的发展。许多基于此框架的算法被设计出来并在实践中成功应用。随着数据规模的爆炸式增长,集中式优化算法因受限于单机的计算瓶颈而难以求解大规模优化问题。而多机协作的分布式机制可以大大降低单机的计算负担。同时,在分布式网络中,节点之间通过相互协调合作,可以有效地解决智能电网、传感器网络等大规模问题,并能提高数据传递效率,增强网络鲁棒性。但在实际应用中,分布式网络一般都在动态环境下运行,传统的批量学习算法在处理大量数据上十分耗时,而在线学习具有实时更新模型的特点,能够根据数据的变化动态地调整模型,进而可更高效地完成对大量实时数据的处理,且其在机器学习、在线推荐系统和资源分配等方面都有着重要的应用价值。然而在实际情况中,梯度信息无法直接获取或者难以获取的这类优化问题在分布式在线优化中占有非常重要的地位,因此研究此类问题具有至关重要的意义。本文主要考虑一类分布式在线优化问题的相关算法及其收敛性结果,本文其余部分安排如下:第1章,介绍了本文所需要的相关背景知识,并简单概述了本文的主要研究内容及创新之处。第2章,考虑在无向图下,对于一类梯度难以获取或无法获取的分布式在线优化问题,即Bandit问题。利用Bandit反馈技术,设计出该问题的Bandit分布式在线算法,并给出相关收敛性分析,同时通过数值模拟实验证明该算法是有效的。第3章,考虑在有向图下,对于现有分布式在线算法不允许应用于一些基于传播的网络的Bandit问题。利用Bandit反馈技术和行随机性质,设计出该问题的算法,并给出相关收敛性分析。最后给出了数值算例证明该算法的有效性。第4章,考虑在时变有向图下,对于现有分布式在线算法在动态的通信图的场景无法处理的Bandit问题。利用Bandit反馈技术和时变行随机性质,设计出该问题的算法,并给出相关收敛性分析。最后通过数值实例证明该算法是有效的。第5章,对本文的研究进行总结并对后续的研究工作做出了展望。
其他文献
中华人民共和国第十二届全国人民代表大会常务委员会在2015年发布的《中华人民共和国刑法修正案(九)》(以下简称《刑法修正案(九)》)中增加了“对有影响力的人行贿罪”,该罪名的增加弥补了贿赂类型犯罪的法律漏洞,也加大了对腐败犯罪份子的打击力度。由于该罪名实际施行的时间较为短暂,在司法实践中对其认定还存在一些不明确的地方。故论文对该罪进行探究,以期解决司法实践中存在的相关问题,为本罪在司法实践中的适用
新疆是全国最大的薰衣草种植基地,已拥有五十年的栽培历史,积累了丰富的种质资源。薰衣草现已广泛应用于医药、食品和日用化工等方面。薰衣草遗传多样性的研究对开展薰衣草种质资源的收集、保存、分类和鉴定工作具有重要的意义。本研究对65份薰衣草种质资源进行了表型性状的田间调查和遗传多样性分析,通过ISSR-PCR及SRAP-PCR反应体系的优化、ISSR及SRAP分子标记引物的筛选和遗传多样性分析的研究,为薰
通信技术的发展使人们对信息传输的速度和质量要求越来越高。60GHz毫米波通信系统凭借丰富的连续带宽资源,较强的安全性以及抗干扰性等优势成为研究的热点。相比低频段通信(例如2.4GHz和5GHz等),高频段通信为人们带来便利的同时,也带来相应的挑战,比如射频器件非线性失真带来的问题。本文主要研究60GHz毫米波通信系统中射频器件非线性失真中的相位噪声问题,并通过研究相噪估计和补偿算法来抑制接收信号的
我国城市地铁建设规模巨大,分布地域十分广泛,地质条件复杂多变,其中,砂卵石地层因具有石英含量大、卵石强度高和透水性强等显著特点,其特殊性和复杂性给盾构隧道的设计、施工和长期运营安全带来了巨大技术挑战,针对该类地层的管片结构设计及荷载计算理论也有待完善。有鉴于此,本文依托成都地铁6号线盾构隧道工程,采用资料调研、现场实测、数值仿真、模型试验及理论分析等研究手段对砂卵石地层叠线小净距盾构隧道管片衬砌力
2’-岩藻糖基乳糖(2’-fucosyllactose,2’-FL)是一种具有益生功能的人乳寡糖,广泛应用于食品和医药等领域,特别是作为婴幼儿配方奶粉的添加成分,近年来备受关注。传统上生产2’-FL的方法包括天然产物提取法及化学合成法等,但二者均存在成本较高、污染严重等缺点,因此反应温和、绿色环保的生物发酵法成为当前2’-FL生产的研究热点之一。本课题以大肠杆菌BL21(DE3)作为出发菌株,对该
天然酶是一类具有高效催化活性和底物专一性的生物大分子,由于稳定性差,提取困难和成本高等内在的缺陷极大地限制了其广泛应用。纳米酶作为新一代的人工酶,是指一类具有天然酶特性的纳米材料,当前已被开发模拟天然酶的结构和功能。类氧化酶是一类能模拟天然氧化酶的纳米材料,当前已报道的类氧化酶已应用于分析检测、癌症治疗、环境保护和体外抗菌等领域。由于催化活性可调、制备简单和成本低,近年来具有氧化酶活性的锰基纳米材
对许多工程实际问题,特别是对于三个方向上尺度相差不大的结构构件,应用现有的梁板理论会产生明显的误差,甚至是严重的错误。此时,三维分析就显得尤为重要且必不可少。 功能梯度材料是近年来为满足高技术领域的需要而兴起的一种新型复合材料。它由两种不同性能的材料组成,采用先进的材料复合技术,使中间的组成连续呈梯度变化,内部不存在明显的界面。 弱形式求积元法是一种基于变分原理的新型全离散数值
本文利用代数方法研究了分子高激发振动态,尤其是过渡态和解离态的动力学。我们发展了动力学势方法,并利用它和相空间轨迹、李雅普诺夫分析研究了DCO的高激发振动态和解离动力学。我们还建立了一个简单的研究弯曲振动过渡态动力学性质的模型。我们所使用的代数哈密顿量是由光谱学实验数据确定下来的,因此代数方法的内涵和结果是与实验紧密相联系的。 我们利用polyad数对DCO的高激发振动的能级进行分类。对于
一个系统可以定义为对象或者元件族,它们被相互连接成一个具有确定功能或目的的群体。系统能实现的功能则是由系统中元件所具有的功能和元件的连接方式决定的。系统中元件的连接模式称为该系统的互连网络,或者简称为网络。系统的互连网络逻辑上指定了该系统中元件之间的连接方式。互连网络可以用图来表示。图的顶点表示系统中的元件,图的边表示元件之间的物理连线,而关联函数指定了元件之间的连接方式。在互连网络的设计中,一个
纤维增强复合材料(Fiber Reinforced Plastic,FRP)因其轻质高强、耐久性能优异近年来已被广泛用于结构加固工程中,而在桥墩抗震加固中对FRP材料施加预应力可以大大提升其利用率,充分发挥材料高强度的优势。目前国内外在该领域的研究工作还不充分,对预应力CFRP加固震损钢筋混凝土桥墩的结构行为、承载能力、设计方法等还缺乏必要的研究成果。本文结合国家自然科学基金研究项目“增强纤维复合