论文部分内容阅读
随着改革开放的进行,保险业的垄断地位被打破,由原来的一家保险公司到现在的数十家,各公司之间的竞争也越发激烈。被动式的服务正转变为主动式的服务,面对大量的业务保单如何才能利用这些数据为公司的发展提供潜在的帮助,让这些数据发挥巨大的增值作用,正是本题的来源。与其他行业相比,保险业拥有更多有关客户的数据,谁能正确地挖掘与分析隐含这些数据中的知识,谁就能更好的控制客户理赔风险,同时又可以向客户提供更好的保险产品与服务,从而在竞争中获胜。国内对这方面的研究还刚刚起步,国外在这方面已经大大地领先于国内。因此,研究数据挖掘技术在我国保险业中的应用具有重要的价值。
数据挖掘是从大规模的数据中抽取非平凡的、隐含的、未知的、有潜在使用价值的信息的技术。随着信息技术的飞速发展,各行业的业务数据规模也不断增大,同时,数据挖掘技术不断成熟并逐渐向行业应用方向飞速发展。随着国内保险业的快速发展和保险市场竞争的不断加剧,为了提高市场占有率,充分了解客户的购买行为,数据挖掘技术是一种非常好的数据分析工具。
本文首先分析了我国保险业中业务数据的现状,介绍数据挖掘理论,接着重点研究保险公司如何在构建数据仓库的基础上运用数据挖掘技术开展客户的分析和理赔分析。并以此为实例构建模型,运用决策树和关联规则分析实现模型。在国外已有研究基础上,结合我国保险业的实际需要,利用Microsoft公司的Sql Sever2005数据挖掘工具建立模型并进行验证与评价。
本文通过深入了解保险行业的领域知识以及对数据挖掘技术、数据仓库技术的学习研究,详细阐述了数据挖掘技术以及数据仓库技术在保险业客户分析中的应用。本文首先从保险业的基本流程入手,详细阐述了客户细分、客户风险等领域的背景知识,介绍数据挖掘和数据仓库技术在该领域分析中的应用,然后从数据仓库概念入手,分别介绍了数据仓库概念模型和逻辑模型的设计与实现。从数据挖掘技术入手,分别介绍了神经网络、判定树、关联规则等算法。然后根据保险业务数据实现了一个数据挖掘保险客户分析系统,本文对这个系统的体系结构、数据模型以及各个功能模块都做了详细的介绍。
本文希望通过这些研究,为将来在保险行业中,广泛推广数据挖掘技术做些试探性的尝试。也希望能为保险行业的操作人员提供有价值的信息,为更好地满足客户和公司的发展的需求做出一点贡献。