论文部分内容阅读
运营商的营业厅每月都会办理大量的业务,这些业务中大部分是按照规定办理的正常业务,但是还有一小部分是异常业务,这些业务可能是有意或无意地没有按照业务规定办理的,有可能给公司造成潜在的经济损失。为了对这些业务进行管理,建立有效的业务监管体系至关重要,本文对这个问题进行研究。论文的主要工作如下:第一部分对数据进行预处理,为之后的建模做准备。这一部分对连续数据的离散化方法和不平衡学习问题进行了重点介绍。在初步的分析之后,发现正常业务和违规业务数量有着较大差异,为了消除类别不均衡对分类器性能造成的影响,使用SMOTE算法生成新元组对少数类元组进行扩充,并通过实验确定合适的输入参数。此外使用等宽离散化方法对连续属性进行离散化,为之后的分类算法构建标准的数据集。 第二部分研究业务建模问题。这一部分首先简要介绍了基于规则的分类算法和关联分类算法,然后提出一种基于重要属性的策略来加快规则构造和规则剪枝过程,这里的重要属性是通过将所有属性按照信息增益率降序排序来确定的,最后将本文的算法应用于项目数据中,实验验证了算法的有效性。 第三部分研究对营业厅业务进行抽检的问题。这一部分首先对可能影响营业厅业务办理行为的因素进行分析,确定了业务量变动和抽检力度这两个因素将对营业厅行为产生重大影响。对于业务量因素,本文提出使用业务量簇结构的变动来衡量目标营业厅的业务量的变动情况;对于抽检因素,本文提出使用抽检比例与违规比例的相关性来衡量抽检力度对违规行为的影响。然后将两个因素综合起来计算抽检比例,用于指导对营业厅业务的抽检行为。最后通过实验验证了本文方法的合理性。