数据不平衡的联邦学习方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:gaylene
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代来临,同一行业内、不同行业间的大数据都可以联合起来产生巨大价值,大数据及人工智能相关技术飞速发展并被大规模投入应用。在人工智能领域,传统的数据处理模式往往是集中式的,各方收集的数据将被集中至同一处进行预处理、清洗及建模。但随着大数据相关技术及人工智能的发展和应用,数据的安全性和隐私性越来越受到相关部门及企业的重视,各方政府也相继出台了相应法律法规,限制隐私数据的流通与共享,由此产生了“数据孤岛”的问题。针对这个问题,谷歌首次提出了联邦学习的概念。联邦学习是一种使得各数据拥有方在保障数据安全和数据隐私的前提下能进行协同训练的机器学习框架,可以保证不同的数据拥有方在不共享数据的情况下进行协同训练,共享数据价值但不共享数据。目前以Google的联邦平均算法(Federated Averaging)为代表的一类主流联邦学习算法是通过集中计算模型参数或梯度从而共享学习到的知识,但是这一类联邦学习算法存在以下问题:1、在各方数据类别存在显著不平衡情况下,算法性能下降严重;2、针对敏感性高的数据,直接进行模型参数的交互存在安全风险和隐私风险。针对以上问题,在数据集严重不平衡情况下,设计了两类联邦学习算法。在数据严重不平衡但对机器学习模型隐私性要求不高的情况下,针对传统联邦学习算法在数据类别不平衡时性能下降的问题,设计了参数共享的联邦学习算法,通过迭代传递子模型间参数的方式,大大提高了模型性能。并在公开数据集上对其效果进行了评估,结果表明此算法使得准确率和损失值都逼近相同数据集在集中式机器学习下进行训练的结果。针对模型敏感性更高的严重不平衡数据,由于参数共享的联邦学习算法中存在模型参数的直接交互,有一定泄露数据隐私的隐患,引入了知识蒸馏的思想,设计了针对高敏感的不均衡数据的预测信息共享联邦学习算法,进一步提高了数据隐私的安全性,杜绝了底层数据泄露的危险,且支持各数据拥有方模型异构。针对公共数据量不足的情况,本文还进一步通过自生成公共数据集的方式改进了针对高敏感的不均衡数据的预测信息共享联邦学习算法,大大提高了准确性,降低了损失值。
其他文献
以205/55 R16子午线轮胎为研究对象,改变轮胎横截面的宽度,分别建立扁平率为45%,50%,55%,60%和65%的轮胎有限元模型,利用Abaqus软件对不同垂向负荷和充气压力下5种扁平率轮胎进行静态接地特性(接地印痕和法向接触应力)分析.仿真结果表明:随着扁平率的增大,沿轮胎轴向的接地印痕宽度减小,沿轮胎滚动方向的接地印痕长度在扁平率为60%或65%时最大;扁平率对轮胎接地印痕面积的影响较大,扁平率越大,轮胎的法向接触应力分布越不均匀,翘曲现象越明显;相同扁平率的轮胎,垂向负荷越大,胎肩处的法向接
采用熔体共混法制备有机粘土(OC)/丁基橡胶(IIR)纳米复合材料(IIRCNs),研究OC的结构变化以及IIRCNs的物理性能、微观相态和气体阻隔性能.结果 表明:OC用量为10份时,IIRCNs中的OC片层间距增至4.09 nm (OC的起始片层间距为2.96 nm),形成插层结构良好的复合材料,IIRCNs的拉伸强度为16.20MPa,较IIR胶料的8.00MPa提高102%,且OC在橡胶基质中的分散形态较为细致、均匀;经过预应力循环拉伸处理后,IIRCNs的拉伸强度达到17.30 MPa,较未预应
自治域(Autonomous System,AS)是网络空间的基本组成单元和信息资源的载体,是一种通过路由设备和边界网关协议(Border Gateway Protocol,BGP)形成的独立自治的互联网络,不同维度的自治域拓扑关系反映了网络空间的不同维度的视角和治理关系。每个自治域都有其归属的特定的组织机构,不同的自治域可能归属不同的组织机构,也可能被同一家组织机构所管理。区别于传统以节点的度和
采用热脱附-气相色谱/质谱和顶空气相色谱/质谱分别对车间硫化烟气和实验室模拟硫化烟气进行分析,并研究两者间的关系.结果 表明:车间硫化烟气热脱附优化条件为脱附温度180℃,脱附时间15 min,冷阱温度-65℃;以顶空进样器模拟橡胶硫化过程来进行实验室模拟硫化烟气成分分析;相同胶料的车间硫化烟气检出成分少于实验室模拟硫化烟气检出成分,但两者大部分成分相同,相同成分多为毒性较大的含氮类化合物和苯等;车间硫化烟气与实验室模拟硫化烟气解析量基本呈正相关.
采用TP700多路数据记录仪对隔震橡胶支座(以下简称支座)的硫化过程进行温度监测,利用阿累尼乌斯方程式计算支座各胶层的硫化效应、等效硫化时间以及硫化程度,并对支座的硫化工艺进行优化.支座的优化硫化条件为120℃×7h,在该优化硫化条件下支座的硫化时间大幅缩短,硫化设备利用率提高,生产成本降低,产品性能满足设计要求.
采用旋转流变仪、橡胶加工分析仪、压缩生热试验机、回弹仪测试胎面胶的动态能量损耗,针对应变、应力、能量3个因素建立了各测试方法的简易应变/应力-时间数学模型,探讨论胎面胶的动态能量损耗与损耗因子(tanδ)的相关性.结果 表明:旋转流变仪和橡胶加工分析仪都是恒定应变测试,二者测试的胎面胶的tanδ相关性较好;压缩生热试验机是恒定应力测试,测试的胎面胶的动态能量损耗与tanδ成正比、与模量成反比;回弹仪是接近恒定能量测试,测试的胎面胶的动态能量损耗与tanδ成正比;轮胎的滚动阻力指数与胎面胶的tanδ线性相关
针对空实向结构橡胶牵引球铰,设计出新型弹性多瓣椭圆孔缩径工装(简称椭圆孔缩径工装)及相应预压缩工艺,以解决空实向结构橡胶牵引球铰圆度过大的问题.试验结果表明,与传统轴向圆孔挤压工艺空实向结构橡胶牵引球铰相比,新型椭圆孔缩径工艺空实向结构橡胶牵引球铰圆度减小82%,径向刚度略微增大,粘合性能和耐疲劳性能未发生明显变化.新型椭圆孔缩径工艺可用于空实向结构橡胶牵引球铰的批量生产.
以绥中36-1环烷基减三线馏分油为原料油,分别采用自制加氢精制ZQC催化剂和进口催化剂进行单段高压加氢试验,在反应压力为15 MPa、氢油体积比为1000/1的条件下,开展不同空速及反应温度下芳香基橡胶增塑剂A0709(简称A0709)制备的研究.结果 表明:采用自制ZQC催化剂,在空速为0.5 h-1、反应温度不低于320℃时,可生产出满足国家标准要求的A0709产品,该反应温度比采用进口催化剂时的反应温度降低20℃左右;采用自制ZQC催化剂制备的A0709对不溶性硫黄的填充性能与市售橡胶填充油相当.
依据现行设计规范JT/T 4-2019《公路桥梁板式橡胶支座》,设计并试制了三元乙丙橡胶(EPDM)板式支座,并结合试验与数值模拟技术,研究该支座的弹性模量和在最不利工况组合下的力学行为特征.结果 表明:EPDM板式支座的弹性模量满足规范要求;在最不利工况下板式支座的橡胶层与钢板之间未出现脱开现象,满足工程设计要求.
研究废旧半钢和全钢轮胎裂解炭黑的基本性质及其在天然橡胶中的应用,并与炭黑N330和N660进行对比.结果 表明:全钢轮胎裂解炭黑的基本性质指标优于半钢轮胎裂解炭黑,吸碘值较大,其填充胶料的拉伸强度与炭黑N660填充胶料相当,损耗因子小,可部分替代炭黑N330或N660使用.