【摘 要】
:
在机器学习的分类任务中,根据类别之间是否有序,可以把分类任务分为无序数据分类和有序数据分类.比例优势模型是处理有序数据分类的一个常用的模型.但是传统的比例优势模型假设不同类别系数变量是相同的,而在实际情况中并非总是如此.文章对比例优势模型进行改进,不要求不同类别的系数变量完全相同,并且引入fused-LASSO和fused-MCP正则化惩罚.利用MM算法求解模型,并通过最小化BIC准则对正则化参数
【基金项目】
:
国家自然科学基金(11731013)资助课题;
论文部分内容阅读
在机器学习的分类任务中,根据类别之间是否有序,可以把分类任务分为无序数据分类和有序数据分类.比例优势模型是处理有序数据分类的一个常用的模型.但是传统的比例优势模型假设不同类别系数变量是相同的,而在实际情况中并非总是如此.文章对比例优势模型进行改进,不要求不同类别的系数变量完全相同,并且引入fused-LASSO和fused-MCP正则化惩罚.利用MM算法求解模型,并通过最小化BIC准则对正则化参数进行选择.模拟数据研究和真实数据分析都说明改进后的模型比传统的比例优势模型在处理有序多分类任务时有更好的效果.
其他文献
一百多年来,针对南极的科研活动一直开展得如火如荼。随着南极科考活动以及商业活动的数量不断增多、规模不断增大,用以支持这些活动的能源的需求也在逐步上升。传统化石能源的使用会对南极环境造成严重的破坏,已经在南极投入使用的清洁能源如太阳能、风力发电受气候因素影响较大,不能保证稳定的能量供应。射频能量作为一种新兴能源,优势主要在于:1.可随时随地收集;2.完全无污染。这两个优点使得射频能量适用于南极这种气
气象监测指导着工农业生产、交通运输、国防等各行各业,与我们每个人都息息相关。风速风向是气象监测中必不可少的关键信息,风速风向传感器的开发和研究对国民经济的发展具有重要的意义。与传统的机械式风速计如风杯、风向标等相比,MEMS热式风速风向传感器具有体积小、维护成本低、量程大、精度高等优点。本实验室自2000年来一直进行着MEMS热式风速计相关的研究,在设计、制造、封装、电路系统上积累了大量的成果与经
安全文本中蕴含着大量重要的信息,如果能够从中自动抽取出威胁情报相关信息并生成结构化威胁情报,对于安全态势感知具有重要意义。在众多的威胁情报表示标准中,STIX标准具有类型丰富,共享方便等特点,是目前使用最为广泛的威胁情报表达标准。因此,本文的研究目标是实现一个威胁情报抽取系统,将非结构化的安全报告自动转换为结构化的STIX格式威胁情报。本文的主要工作如下:(1)基于STIX 2.0标准制定了抽取目
导电弹性体作为兼具高机械弹性和高电学导通性的导电功能材料,能够弥补传统柔性电子在可拉伸性上的不足,而被越来越多的应用于柔性显示、柔性可穿戴设备、智能机器人等领域,这能进一步丰富电子产品的种类和功能,因而其受到越来越多的关注,近些年来成为柔性电子领域的一个重要研究方向。目前,国内外针对导电弹性体的研究工作主要集中在导电弹性体的制备,弹性电路的加工以及传感应用的研发上。本课题围绕导电弹性体的热点研究问
日益频繁的非法交易行为妨害以太坊安全交易,针对电子货币的匿名性使得非法交易行为难于跟踪分析问题。以以太坊平台交易数据作为数据源,以被标记得非法账户和未标记的正常账户数据集作为训练集,利用交易数据的特征属性为构造基础,通过CatBoost算法对其中包含多种类型的非法账户进行整体预测。其过程通过T-SNE算法实现交易特征的降维可视化,采用多倍交叉验证,引入SHAP Value因子判断特征影响的正负属性
需求响应(Demand response,DR)和分布式电源(Distributed generation,DG)随着主动配电网(Active distribution network,ADN)技术的迅速发展而得到不断推广,不仅促进了用户与电网之间的网荷双向互动,同时也影响着配电网的供电可靠性与经济性。配电网可靠性与经济性是一对矛盾体,如何协调需求响应成本与配电网可靠性提升程度是目前亟待解决的问题
近年来电网公司将区块链技术纳入能源互联网技术框架,要求在多元业务创新应用上更快推进,同时随着配电网规模的扩大和社会用电负荷的增加,配电网发生故障的风险大大提高,对于故障抢修工作的研究显得愈发重要。区块链技术具有的去中心化和可追溯、防篡改的特点,对于有多种主体共同参与的配电网抢修场景尤为适用,同时对客户评价数据进行价值挖掘,也有利于电网公司改善用户体验。因此,基于区块链的抢修服务调度与评价系统,是当
永磁同步电机(Permanent Magnet Synchronous Machine,PMSM)具有结构简单、高效率和高功率密度等优点,但其气隙磁场难以调节,限制了其应用场合。近年来,一类采用高剩磁、低矫顽力永磁材料的变磁通记忆电机(Variable Flux Memory Machine,VFMM)得到了广泛关注和研究,该电机通过施加瞬时电流脉冲来改变永磁体的磁化状态,几乎无励磁损耗,可实现调
为使成品油企业能够合理地进行生产、销售和库存决策,必须要先对成品油的市场价格做出准确的预测.然而,成品油价格由于受产销存等多种因素影响,使得成品油价格预测十分困难.为此,根据成品油价格数据自身的记忆性特征,文章构建了一个记忆性特征驱动的分解集成预测模型,并采用两种常见的成品油种——93#汽油和0#柴油的价格数据来验证该模型的有效性.实证结果证实基于记忆性特征驱动的分解集成预测模型能够获得比单模型更
计算机技术的快速发展促进了人工智能在教育中的应用(AIED)。在人工智能技术的帮助下,计算机可以仿真教师的智能进行推理、判断或预测,为学生提供个性化的指导、支持或反馈,以及协助教师或教育决策者作出决定。尽管AIED已被确定为计算机和教育领域的研究重点,但研究者在进行这种高科技和跨学科的研究时普遍感到具有挑战性。有鉴于此,使用文献计量分析方法,透过对发表在国际高质量期刊的文献进行分析,来了解现阶段A