基于多目标多约束水平线性规划的分类错误修正研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yzq4308
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门新兴的交叉学科,它从数据(尤其是海量数据甚至大数据)中发现有用的知识和规律,提炼出客观世界的隐含模式,以此指导进一步的科学决策。在数据挖掘的基本问题中,分类问题是应用最为广泛的,存在于各行各业各个领域。解决分类问题有多种方法和模型。其中,基于最优化的分类算法是一类主要的方法。对于一个典型的二分类问题,利用基于最优化方法,通过模型对数据进行学习,给出一个分类超平面,再利用得到的分类超平面来判断未知样本点的类别。事实上,对于大多数复杂问题,这样的方法不可避免地会产生分类错误。鉴于此,本文以分类问题为研究对象,以如何对分类问题中的错误进行控制和修正为研究重点,探索有效修正错分点的方法,构造可以减少错分点的新模型。另一方面,本文特别注意到在许多实际应用(例如信用卡用户划分问题)中,对不同类别错分点的关注程度大不相同,带来的影响也大相径庭。因此,借助假设检验中两类错误的概念,论文将错分点看成两类错误,进一步发展新的模型以分别减少两类错误发生的概率。  本文首先回顾了多目标多约束水平线性规划(MC2 LP)问题的衍生和发展,介绍和探讨了求解MC2 LP的单纯形方法,包括矩阵规划(MP)问题、线性规划(LP)问题和多目标线性规划(MCLP)问题,以及它们之间的关系。接下来,以原始MCLP分类模型为研究对象,通过给出其矩阵表示形式,本文研究了其具有的一些基本性质。然后,基于这些基本性质,本论文提出了两个减少错分点的新模型,并对它们的性质和求解方法做了初步的研究。进一步,以原始MC2 LP分类模型为切入点,通过分析其不足之处,本论文研究并提出了新的双超平面MC2 LP分类模型。该模型有效地避免了原始MC2 LP分类模型的缺点。另外,新模型充分利用了多约束水平的灵活性,突显出截距项在分类效果上的重要作用。由此,本文发展了两个可以对两类错误进行分别修正的双超平面MC2 LP分类模型。最后,通过对新模型性质的研究,给出了新模型在修正两类错误方面有效性的解释,并对模型的计算复杂度进行了一定的分析。特别地,提出了一个基于新模型求解分类问题的启发式算法。选取三个UCI数据集以验证新模型的有效性。三个数据集分别测试了模型在均衡数据集和非均衡数据集上的效果。同时,借助损失矩阵的概念,论文展示了新模型在修正两类错误上的有效性。这些实验结果说明,新的双超平面MC2LP模型可以显著地修正两类错误。换句话说,在一个二分类问题中,新模型在保持整体准确率不明显降低的同时,可以有效地提高对某一类的分类准确率,并且这样的效果在测试集上有着较好的泛化能力。特别地,根据MC2LP方法的特点,在取定双超平面的不同折中之后,新模型实现了对错误率的有效控制,这使得新模型具有良好的实际应用前景。
其他文献
学位
学位
学位
学位
语感是一种主体对言语的感受能力、理解能力、生成能力和判断能力.具备了良好的语感能使人感受言语之精妙,洞见言语之精髓,把握言语之理趣,更能使其步入丰富而又美妙的精神世
学位
学位
随着汉语教材一套一套新版的改编,低年级学生的识字量也明显增多.如何激发学生的识字兴趣,培养识字能力,提高识字效率,已成为众多教师的研究话题.作为一名小学汉语教师,我深
学位
学位