象形包裹流形理论及其在模式分类中的应用

来源 :大连海事大学 | 被引量 : 2次 | 上传用户:ESC_liangzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通运载工具(如车、船舶等)在运行中如果发生故障,轻则降低或失去其预定的功能,影响生产,造成经济损失;重则导致严重的以至灾难性的事故,造成人员伤亡或者恶劣的社会影响。因此对交通运载工具进行有效的状态监测和故障诊断是保障其正常运行和故障的及时预警和处理的重要手段。模式识别是人工智能领域中的一个重要方面。经过多年的发展,模式识别技术已经在很多行业得到应用。简而言之,模式识别的核心就是分类,分为监督模式识别和非监督模式识别。利用模式识别技术对交通运载工具的状态监测和故障诊断对于实现实时、智能、高效地实施对它们的工作状态进行监控,从而保障其正常运行和故障的及时预警和处理都具有重要的理论意义和实用价值。但是随着信息技术的迅速发展,数据采集能力的提高导致交通运载工具运行数据的数量和维数呈指数级增长。对海量、高维和复杂非线性数据处理的需求迫切要求模式识别领域提出新的、适应这些要求的算法。本文分析和研究了针对离散数据模式识别方法中的四种重要方法——人工神经网络、支持向量机、流形学习和仿生模式识别方法的现状和特点。人工神经网络、支持向量机在进行监督模式识别时,把在不同类别的样本间建立的分类界面作为分类器来区分不同类别样本。人工神经网络在训练分类器时,需要选择较多的参数,并且在训练时存在着局部极小点的问题。有时即使对同样一种神经网络方法,在一些应用中可能取得很好的结果,而在另外一些相似的应用中却可能完全失败。支持向量机在训练分类器时的一个核心计算是求解二次规划问题。当样本数量较多时,支持向量机存在二次规划求解速度慢、算法复杂等困难。这些问题和困难在很大程度上制约了人工神经网络和支持向量机方法的理论和应用的发展,也引发了学者们对其它方法的探索。与这两种方法不同,流形学习和仿生模式识别方法是两种基于探索和利用数据本身的内部几何结构(数据的一种内在本质)进行模式识别的方法。流形学习源于高维数据问题,核心是在高维数据中找到这些数据所在的低维流形。而仿生模式识别则是通过为数据建立覆盖来表达数据的几何结构。这两种依据数据本身的几何结构进行模式识别的方法使模式识别深入到了数据本身的内在性质,因此这些方法是属于揭示数据内在本质的模式识别方法。但是,我们通过对两种方法的原理和应用进行深入研究,发现其中也存在一些问题。例如,它们假设高维空间数据应分布在某一个低维流形上。然而如何确定高维数据是分布在某个低维流形上,以及对这个低维流形维数的确定,都是这些算法中遇到的比较困难的问题。在这些方法的启发下,针对这些方法所存在的一些问题,在深入研究这些方法原理和特点的基础上,结合拓扑学、微分几何的流形理论,本文提出了象形包裹流形理论。该理论通过光滑流形对欧氏空间中的高维离散数据进行包裹,从而实现对高维离散数据的整体几何结构的有效表达。文中同时进行了相关的理论分析和证明。提出了一种在二维可视空间上分析高维数据及其象形包裹流形的简单方法——任意方向坐标轴法。提出了象形包裹流形模式分类算法及其分类策略。本文对所提出的象形包裹流形表达数据结构的方法和象形包裹流形分类计算方法进行了仿真实验,实验结果验证了上述方法简单有效;通过在理论证明和分析时对任意方向坐标轴法的应用,验证了该方法的直观性和有效性。本文的主要工作概括如下:(1)提出了象形包裹流形(Pictographically Wrapping Manifold, PWM)的数学模型——建立关于数据集的函数和方程,结合拓扑学和微分几何理论证明了该方程的解集为闭流形。文中据此给出了数据的PWM的定义。数据的PWM可以在高维数据的原空间上有效地表达数据的几何结构,并且不需要找出数据的低维流形维数及能够保持数据几何结构的自然状态。文中还给出了也能够对数据进行象形包裹的PWM扩展方程的数学模型。文中的两个直观二维离散数据集的实例验证了PWM表达数据几何结构的有效性。(2)针对目前对于高维数据普遍缺乏可视化研究手段的现状,本文提出了一种将非直观高维数据及其PWM问题转化为在可视的二维平面中进行讨论的方法——任意方向坐标轴法(Axis of Arbitrary Direction, AAD)。应用AAD证明了当参数满足一定条件时,所得到的PWM与n维欧氏空间的球面同胚。应用AAD和实例说明了当参数变化时,PWM存在分裂与融合的变化:当参数变化趋势不同时,PWM将经历分裂或融合过程。应用AAD和实例说明当参数满足一定条件时,PWM将分裂为与数据集中数据数量相同的流形分支,并且每一个分支都与n维欧氏空间的球面同胚。对AAD的成功应用,验证了该方法的简单和有效性。(3)在建立离散数据的PWM的基础上,提出了PWM监督模式分类方法,并给出了PWM解决单类和多类问题的分类策略。该算法直接把PWM作为分类器,不需要另外构造分类器。该算法在实际应用时不需要将流形求出,不存在构造分类器而引起的计算代价,极大地减少了算法本身的复杂程度(这也是该算法与大多数监督模式分类算法的最根本的差别)。该算法的分类策略算式简单,在计算全过程中无优化计算、无矩阵计算、无高维空间的向量计算等,所有计算只包括简单的加、减、除、乘方计算,所以当维数增大、样本量增大、非线性复杂程度增加时,对算法的复杂程度影响很小。因为PWM是数据几何结构的表达,所以这种算法是揭示数据内在本质的模式识别方法。PWM监督模式识别方法原理易于理解、算法简单,适用于高维、大容量样本和复杂非线性问题。对两条螺旋线状数据点的分类验证了该方法的有效性。文中对两个种子点的PWM连通性进行了讨论,提出了参数c的初选方法,并且给出了该模式分类方法的评价指标。(4)对PWM分类算法在应用时可能出现的重叠问题,本文提出的流形内距离和流形外距离等概念,可方便地用于确定数据点与流形的相互位置关系,从而避免了在高维空间中寻求数据点与流形的距离的复杂计算,使PWM监督模式分类方法在实际应用时的计算非常简单。文中针对重叠问题给出的子流形法、流形距离法和混合法分别适用于训练集重叠、测试集重叠和子流形法子层较多的情况。本文应用PWM分类算法对一组回转机械故障测试数据进行了分类实验,实验结果表明当选取适当的参数时,PWM分类算法能够有效地应用于这个分类问题,并且验证了该方法的有效性。
其他文献
目前对水下超空泡航行体的结构问题研究较少,对其结构进行可靠性分析的研究则更少。与传统速度较低的水下航行体主要受全面静水压力有所不同,高速运行下的超空泡航行体所受前
在国内商业银行中构建以价值管理为核心的管理会计体系,就是要根据精细化管理的需要,构建产品、顾客、产品/顾客组合、业务条线、机构甚至部门为分析对象的价值中心,并且通过
水翼法推进是水下运载器新型推进方式的探索性研究工作。研究水翼法推进机理与性能,分析理解仿生系统水翼推进操纵方式,为仿生水下运载器研究和应用提供理论和技术支撑,具有
中药在国人的心目中,一般都是作用好,毒性小,但为何有的患者服用中药以后,会出现头昏、胸闷、呕吐等症状?中药真的无毒副作用吗?中药可以长期应用吗?
应用PCR DGGE方法在61个单纯性先天性心脏病核心家系共216位成员中检测TBX5基因8个外显子的突变情况;以β actin作为内对照对单纯性先天性心脏病患者(房间隔缺损12例、室间隔
随着海洋油气资源开发逐步向深海(水深500-1500m)和超深海(水深大于1500m)发展,各种新型海洋工程结构物不断涌现。目前,新型海洋工程结构物的设计研究主要集中在浮式海洋平台
目的探讨红霉素与阿奇霉素序贯治疗小儿支原体肺炎临床效果。方法选择笔者所在医院2008年10月~2010年10月支原体肺炎患儿80例,随机分为观察组和对照组。对照组患儿给予阿奇霉
哮喘病和易感症的遗传学病因是复杂的,现可通过候选基因和易感位点筛选技术来进行研究。本文综述了哮喘易感基因的研究进展,同时讨论了哮喘遗传学研究对哮喘临床的应用前景。
瘢痕会给患儿带来容貌和功能损伤,并可能产生一系列并发症,包括多毛症、汗腺分泌障碍、疼痛、瘙痒、感觉迟钝等,亦可能影响受累部位的发育。目前,治疗瘢痕的方法很多,但尚无
目前,国内呈现娱乐冰场和竞技冰场蓬勃发展时期。介绍了目前主流冰场制冷系统的结构与工作原理,论述了系统设计要点,给出了低温冷水机组、制冷盘管、水泵、乙二醇循环泵、冷