基于强化学习的结构化数据实例选择方法研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:ly12345000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据的获取渠道、维度及数量的增加,人们直接收集到的数据集中可能包含着许多噪声、失实、冗余等影响数据集质量的实例。这些实例的存在,将对后续机器学习模型的训练产生负面影响,甚至降低决策模型的表现。因此,如果我们可以通过合理的实例选择,选择出一个更为优质的数据子集,将有可能避免该问题,使数据发挥出应有的价值。基于此场景,本文提出了基于强化学习的结构化数据实例选择方法。该方法从提升模型性能的角度出发,通过将实例选择问题转化为强化学习环境的设计,同时借助强化学习中的相关算法实现了完整的实例选择过程。在具体实现方面,该方法通过将筛选集的建模表现与强化学习的奖励信号挂钩,设计出一套完整的奖励反馈机制,使奖励信号可以反映出基于此筛选集建立机器学习模型的效果。同时,受益于强化学习环境设计的灵活性,方法具有较好的扩展性,可以作为数据预处理的一部分,应用于机器学习建模、数据挖掘等应用场景。为了验证该方法的有效性,本文借助人工数据集与公开数据集,对本方法进行了解释性分析及性能验证。实验结果表明,该方法可以通过剔除对模型性能提升无用的实例,以达到提升建模表现的目的,并且表现出了较好的稳定性。与现有的实例选择方法相比,该方法在提升筛选集建模表现方面存在一定优势,有着较高的使用价值。
其他文献
家族企业是经济社会的重要一员,为助推经济增长贡献了重要力量。在我国改革开放后的发展进程中,家族企业迅速萌芽、成长和壮大,促进了我国GDP、社会财富的增长和就业持续扩大,在中国改革开放发展和经济建设中的地位举足轻重。并且,一些家族企业甚至走出国门,成为中国走向世界的“金名片”。与此同时,很多家族企业显现出发展劣势、家族传承困难等,无法实现可持续发展,在十年内就走向了终结。因而,很多家族企业不得不选择
当前我国在激发经济潜能方面持续发力,政府实施的减税降费等一系列举措“降成本”效果显著,有力地激发了企业发展的活力,一些行业涌现出的大企业数量明显增多。随着我国“放管服”改革的深化,对税收征管工作提出了更高的要求,而“一带一路”等倡议的落实使得跨地区经营的大企业业务范围进一步扩大,相应地大企业税收管理工作的难度也在逐渐增加。从税收可持续增长层面看,全方位、多角度优化大企业税收管理工作,是管控税源、确
创始于1921年的“五芳斋”是国家首批的“中华老字号”之一,以糯而不烂,肥而不腻,肉嫩味美,咸甜适中而著称,被誉为“江南粽子大王”,曾经的“五芳斋”也曾遭遇过品牌老化的现象,如市场反应迟钝,年轻消费者流失等,但相反的是五芳斋近年来通过实施一系列的改革实现了成功转型,如今五芳斋在新一代年轻消费群体中备受亲睐,根据阿里研究院联合北京大学光华管理学院王锐教授2018年发布的《中华老字号品牌发展指数》研究
随着近年来国内证券市场的不断发展,在国家政策的引导和推动下,涌现出了大批企业,市场竞争加剧,因此很多企业通过进行重大资产重组整合企业,进行资源的优化配置。而在企业进行重大资产重组过程中,企业通过信息披露的方式将其进行的相关活动告知除参与方以外的利益相关者。由于我国证券市场的发展起步较晚,在上个世纪末企业进行并购重组活动少,但在近几年国家的号召下,企业迎来了并购重组的浪潮,企业信息披露数量随之增多,
自1970年代以来,信息系统使用行为研究就已经成为了信息管理研究领域的重要分支。在企业界,信息系统已经被视为核心竞争力的重要源泉,越来越多的企业对信息系统进行了大量的投资,以期待获得竞争优势。但是,面对大量的投资,却引发了“生产率”的悖论,Bolton等人的研究报告就指出:存在50%的ERP系统和70%的CRM系统实施失败。学术界认为,信息系统实施失败的一个重要原因在于个体未能持续且创新性使用信息
从2015年开始,我国企业开始进行大规模的海外并购。在我国企业展开的海外并购过程中,受企业自身质量及外部环境的约束,民营企业的融资渠道显得尤为狭窄。在综合考量发展战略与投资成本之后,这些民营企业往往会选择加杠杆的方式来进行海外并购。这种加杠杆的方式会增大跨国并购成功的机会,但同时也会放大并购过程中各个环节所面临的财务风险。如何有效地控制跨国杠杆并购所带来的财务风险,成为民营企业在海外并购中必须面对
光伏发电作为转变能源结构的方向之一,以其高效、清洁、可持续的优势,近年来在我国乃至全球得到了大力发展。为鼓励和支持光伏行业的发展,初期国家投入了大量补贴,我国光伏发电装机量在政策支持下开始出现迅猛增长。截止2017年底,我国累计装机容量超过130GW,连续五年位居全球第一。装机容量的过快增长导致国家财政补贴压力加剧,为促进光伏行业健康持续发展,尽快实现市场化竞争,2018年5月31日国家发改委发布
党的十八大以来,国有企业混合所有制改革进入试点和加速阶段,已进行了三批混改试点,第四批试点工作也已然启动,出现了一批典型的混改案例。医药行业作为典型的充分竞争性行业,行业内国有企业众多。自党的十八大以来,行业内国有上市公司持续推进混改。本文通过案例研究的方法,探究医药行业国有企业控制权安排的方式及具体实现路径,并分析评价混改对于公司绩效的影响。从控制权安排来看,医药行业混改有三种选择方式,其一是继
全产业链这一概念具有浓厚的中国特色,最初是针对中粮集团的发展战略提出的,而后才渐渐运用到农业、食品行业、石油化工等行业,因此,国外的理论研究还比较少,大部分研究都是国内学者针对少数几个公司实施全产业链战略的财务绩效展开的,对于具体的风险分析较少,且主要集中于农业和食品行业。由于各个行业之间存在显著的差异,全产业链战略在不同的企业产生的效应以及面临的风险都不尽相同,因此,针对各个行业进行具体的案例分
互联网视频行业发展至今,行业的成长性和背后所蕴藏的巨大财富皆已得到事实的验证和广泛的认可。回顾行业发展的十五年,参与竞争的企业数量已大打折扣,从早期的四百家降至如今的二十余家。然而竞争的放缓并未让互联网视频企业实现盈利,几乎所有的企业都还在亏损的泥淖中挣扎。为尽快走出投入大于产出的困境,互联网视频企业也积极尝试了各种方法,并购便是其中之一。企业的并购理论上能快速提升企业的竞争力,推动企业飞跃性发展