大规模模式识别模糊分类器设计研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:ly12345000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在海量数据环境中研究模式识别(或分类)问题时,常面临具有如下特点的数据:表示该数据的特征空间维数高,样本数量大而且所涉及的类别数目多。为了解决这类数据的分类问题,在分类器的设计上,不仅要引入不同的分析与计算方法,特别是计算智能的方法,还要考虑它们之间合理的综合与集成。本文以神经网络和模糊数学两种计算智能方法为主要手段,研究和探讨大规模模式识别分类器的集成设计问题。并以脱机手写汉字识别问题作为应用的背景,因为基于脱机手写汉字识别是未来计算机智能接口不可缺少的重要组成部分,同时又由于手写汉字识别本身的复杂性,决定这类问题所涉及的分类边界十分复杂,因而成为研究大规模模式识别问题的典型代表之一。主要的研究工作如下: (1)分析目前国内外神经网络与模糊数学两种计算智能用于模式识别的应用现状及其发展,研究和探讨两者在解决大规模模式识别问题的集成作用,说明大规模模式识别分类器设计中引入计算智能的必要。 (2)以张铃教授提出的自上而下的前馈神经网络设计覆盖方法为基础,研究和探讨模糊数学在神经分类器球面邻域交叉覆盖模糊化的处理方法,设计一种基于球面邻域覆盖的模糊分类器,并以脱机手写汉字识别问题验证分类器的性能。实验结果表明模糊覆盖方法对于解决大规模问题是很有潜力的。 (3)基于学习矢量量化算法LVQ在模式识别领域应用的广泛性,利用其最近邻分类准则,研究模糊数学引入以及实现局部化的处理,减小每个训练样本在参与距离计算时参考点数目,从而在不影响识别率的情况下缩短算法的训练时间。与传统的LVQ算法相比,在训练时间方面有一定程度的改进。 (4)针对大规模模式识别问题用单一的分类器很难得到理想的结果,本文进一步基于系统集成的思想,提出模糊粗分类的方法,并在此基础上构造了一个三级模糊集成分类器,3755个汉字一级字库的脱机手写识别实验表明集成分类器对识别问题性能改善,显示该分类器是解决大规模模式识别问题的一种有效方法。
其他文献
本文采用NURBS曲线曲面方法实现手袋基本形体的曲面造型.提出了一种采用离散法结合三视图投影原理进行曲面与任意平面求交的数值算法.方法简便、快速可靠,效果良好.OpenGL是
随着互联网的快速发展,互联网正在逐渐从一个信息发布共享平台演变成为大规模的分布式计算平台。服务成为互联网面向用户提供应用的主要形式。 现有的互联网中服务在实现层
本文首先给出了分布式应用系统的基本概念.对分布式结构的特点,体系结构和相关理念进行了探讨,并着重分析了构建分布式系统所用到的关键性技术.主要针对MIDAS技术、InternetE
集群系统开放性发展趋势、迅速增长的高性能事务处理应用需求以及移动计算模式的发展需求给集群文件系统提出了一些新的研究课题。本文面向Internet等大吞吐量事务性文件服务
本文提出了基于粗糙集理论的不完备信息系统的处理方法和基于沃尔什滤波的时序数据离散化的方法.粗糙集是建立在等价关系基础之上,用上下近似集合来表示一个不精确的概念.在
随着信息技术和计算机网络技术的不断发展,XML(Extensible Markup Language,可扩展标记语言)元语言特性及结构化的特点使其成为了互联网异构环境中不同类型和不同领域数据交
虚拟现实技术是20世纪末发展起来的一门涉及众多学科的高新技术,它通过计算机创造出的虚拟环境,通过人体的视觉、听觉、触觉、味觉、嗅觉等作用,使用户产生身临其境的感觉.VR
本文首先提出基于HTTP协议的即时通信系统的模型,对模型的设计将从硬件架构和软件架构两个方面展开.然后将对模型进行具体实现,重点解决不同服务器之间的通信、服务端的中间
移动IP在互联网上为移动计算机提供了不中断通信的无缝漫游协议。它突破了计算机机房、信息插座和地域等限制,允许移动节点在移动时穿过不同或者相似的传输媒介,使人们能够随时
移动多跳网MANET(Mobile Ad hoc Networks)是一种特殊的无线移动网络.网络中所有节点地位平等,无需设置任何的中心控制节点.网络中的节点不仅具有普通移动终端所需的功能,而