基于训练集聚类的KNN算法及其应用研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:sxtld
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究K最近邻(K-Nearest Neighbor,KNN)算法及其应用。KNN算法是一种经典的分类算法,该算法需要计算待测样本与每个训练集样本的相似性,相似性通常用欧氏距离表示,然而在大数据的背景下,KNN算法将会产生巨大的计算量,使得算法的效率大打折扣,而且KNN算法中,k值的选取对分类结果也有一定的影响,一般需要做多次实验确定,因此针对KNN算法的以上缺陷,本文做了以下一些主要工作。第一,通过改进的局部线性嵌入算法(Locally Linear Embedding, LLE)对高维数据降维,再结合模糊C均值(Fuzzyc-means,FCM)算法对训练集聚类,从距离待测样本最近的几个聚类包含的数据中,通过计算找到k最近邻,这样就不需要计算训练集的所有样本与待测样本的距离,只计算一小部分即可,然后设计了一种基于距离为k最近邻赋予权值的方法,削弱k值的选取对分类结果的影响。第三章将KNN算法与数据降维、FCM算法、基于距离加权相结合,提出了基于训练集聚类的距离加权KNN算法,通过对模拟数据和UCI数据集进行实验,将新算法与KNN算法进行对比,验证了新算法的有效性。第二,数据的分布通常是不均匀的,对于存在类偏斜的训练集数据,第四章提出了基于训练集聚类的密度加权KNN算法,通过改进的LLE算法对训练集降维,运用K-means算法对训练集进行聚类操作,在找到待测样本的k最近邻之后,用设计的一种基于密度赋予k最近邻权重的方法进行加权操作,根据权重的大小判断待测样本的类别,通过对模拟数据和UCI数据集进行实验,将新算法与KNN算法、基于训练集聚类的距离加权KNN算法进行对比,验证了新算法对于分布不均匀的数据有着更高的分类准确率。第三,将上述两种改进的KNN算法应用于入侵检测数据集KDD Cup 1999 Data,通过与KNN算法对比,验证了改进算法的准确率更高。除此之外,对两种改进的KNN算法进行对比分析,基于训练集聚类的密度加权KNN算法在处理分布不均匀的数据时有着更好的效果。最后,总结了论文中所做的工作,提出可以进一步研究的内容。
其他文献
近年来,随着计算机网络技术的发展,许多软件系统开始在Internet上部署和运行。同时这些系统运行的复杂性和规模也在逐渐增加,呈现出很多新的形态和特点。如何在Internet这样一个
本文要研究的是重尾相依条件下风险模型的大偏差问题.众所周知,在金融保险业中,目前更重视的对象是极端事件.因为这些重大事件不经常发生,可是一旦发生,将会带来巨大损失,导致大索赔额的发生,从而给保险业务带来重大风险.在保险风险理论中,各种破产理论的渐进性的研究与极限理论的大偏差有着密切的关系,故大偏差理论的研究就成为保险公司和广大学者共同关注的重要问题之一.大偏差理论的研究起源于20世纪30年代,一直
宋野岩号兰谿山房主人,秋烟散人。1999年毕业于南开大学东方文化艺术系中国画专业。2008年结业于中国艺术研究院研究生课程班首届山水创作研究室。现为郑州美术馆、郑州画院
本文最主要工作是基于部件“修旧不如新”的条件,研究k/n(G)系统的定数维修模型。   首先,本文在一般定数维修模型下,设定部件“修旧不如新”,以可靠度和维修度服从指数分布为
本文主要研究k-means聚类算法及其应用。在大数据背景下,传统聚类分析算法的局限性已日益凸显,其中最明显的就是传统聚类算法对于小规模简单数据集执行效率高且聚类结果良好,
本文致力于研究一类新的阈值分红策略下相依双险种更新风险模型的折现罚金函数的一些性质。Lundberg-Cramer经典风险模型提出以来,很多学者不断对其进行推广和完善,使模型更加符合保险公司的实际运营情况。时至今日已经提出研究了数十种不同类型的风险模型。随着国内保险业的不断发展成熟,保险市场的竞争日趋激烈,多险种业务已经成为保险公司的主流业务,并且很多险种之间是相互依存,互相关联的,所以研究有相依
学位
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
摘 要:随着时代的不断进步,我国的聚甲醛生产的技术也得到了快速的发展,聚甲醛是一种综合性的工程塑料。随着我国的各个行业的发展,对于这种综合性工程塑料的需求也是越来越大,同时也为我国聚甲醛的生产带来了一些问题,从而影响到了我国聚甲醛生产的效率。因此,本文就聚甲醛的生产和应用进行分析,以期可以提出有效的策略,在解决问题的同时促进聚甲醛生产企业的快速发展。  关键词:聚甲醛 生产 应用  聚甲醛,英文缩
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊