独立成分分析算法及其应用研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:yztny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在神经网络应用、统计分析、信号处理等领域,一个普遍关心和感兴趣的问题是如何借助某种适当的变换,找到源信号的一个恰当的表示.如果源信号的表示有利于后续的分析工作,这将是非常重要的.独立成分分析(Independent Component Analysis;ICA)是一种新的数据处理方法,目的在于从未知源信号的观测混合信号中分离相互统计独立的源信号.基于ICA方法,使得被分析信号各成分之间的统计依赖性最小化,突出了源信号的本质结构.ICA的核心问题是分离(或解混合)矩阵的学习算法,它属于无监督的学习,其基本的思想是抽取统计独立的特征作为输入的表示,而义不丢失信息.当混合模型为非线性时,一般是无法从混合数据中恢复源信号的,除非对信号和混合的模型有进一步的先验知识可利用.因此,在大多数的研究中,只讨论线性混合模型,本文主要讨论了瞬时线性混合的情况.将ICA用来处理盲源分离问题(Blind Source Separation;BSS)已经引起了广泛的关注,并已成功地应用于语音信号处理、通信、人脸识别、图像特征提取、神经计算和医学信号处理等众多领域.由于它在这些领域具有广泛的应用前景,有关ICA的理论和算法研究得到了较快的发展。 时间序列分析是系统辨识与系统分析的重要方法之一,其应用范围越来越广泛.例如在能源生产系统中存在大量时间序列,具有很强的季节性、波动性.现有的时间序列分析方法多采用自同归(Autoregression;AR)、滑动平均(Moving-average;MA)或自回归滑动平均(Autoregressive Moving-average;ARMA)的参数模型.而研究从多个时间序列混合信号中分离出各个信号及进行参数估计是非常重要的.本论文利用ICA和高阶统计量研究了由若干个独立的AR或MA信号叠加形成的多道时间序列的分解与复原的模型和算法.整个论文的结构安排如下: 第一章,扼要地介绍了信号盲分离的概况,介绍了其研究的发展和现状,指出ICA具有很好的应用价值和很广泛的应用前景,随着计算机技术的发展,ICA的研究已经成为当今国内处信号处理领域的一大研究热点。 第二章,从ICA的定义和假设条件出发,阐述了ICA问题具体的数学模型和基本的假设条件;分析了ICA的基本模型及ICA问题的可解性和模糊性,可实现性及等变性等性质;将概率论、信息论、统计理论中有关内容作了介绍,主要是高阶统计量的相关知识:白化这种常规的方法作为ICA的预处理可以有效地降低问题的复杂度,通过白化处理,在高维数据情况下,往往可以减少自由参数的个数,提高方法的性能,本节介绍了白化处理的几种常用方法;由于研究目的的不同,对算法性能指标描述也不尽相同,给出了ICA算法性能评价指标的一种方法——利用合成矩阵与广义交换矩阵的偏差程度来衡量算法的有效性;由于主成分分析(Principal Component Analysis:PCA)是一种信号分析技术,它也是在一定的坐标系中给出信号的最佳表示,在数据进行白化的过程中我们用到了PCA方法,这两种数据处理的方法就分离信号的效果而言究竟孰好孰坏,我们对此进行了比较。 第三章,对经典的ICA(瞬时线性混合的ICA模型)进行了研究.由于盲信号处理的基本框架是根据某种优化准则,选择出合适的评价函数(Contrast Function),采用某种优化方法来搜索评价函数的极值点.具体的评价函数决定了算法的统计性能,优化方法决定了算法的算法性能.本节介绍了五种独立性判据:非高斯性极大化判据,互信息最小化(MMI)判据,信息最大化(MAX)判据,极大似然估计(ML)判据,非线性PCA判据.近年来研究学者们根据不同的优化准则,提出了各种解决ICA问题的方法,本节通过合理的推导和计算,给出了瞬时线性混合的ICA算法的统一形式及它们的收敛条件.通过模拟实验验证了该准则的有效性.住此基础上,分析了非线性函数选取对算法的影响.由于源信号的混合是未知的,它既包含超高斯义包含Ⅱ高斯信号,在此基础上提出了一种新的基丁极人似然估计的算法,该算法能够分离超高斯和弧高斯分布源的混合信号。 第四章,自然界中的各种过程都不是孤立的,研究有成冈联系的多道系统更能反映过程特征.这一章研究了由若干个独立的AR或MA信号叠加形成的多道时间序列的分解与复原的模型和算法,首先从信号的独立性出发,利用信号的高阶统计信息,在假设原信号都是AR或MA的情况下,主要用到ICA算法,寻找一可逆矩阵将混合信号复原,然后再利用AR或IVlA信号所具有的性质估计出源信号的阶数及参数.并通过仿真实验模拟了信号的复原及参数的估计.此种方法的特点是不需要知道序列的参数,也不必知道线性叠加的系数矩阵,而仅从观测信号可最终得到信号的参数估计,为了检验方法的正确性及实用性,进行了大量的仿真分析工作:改变观测序列数;改变信号的自回归过程阶数和自回归系数;改变线性叠加系数矩阵(系数矩阵可逆)等,对上述仿真实验均可获得较好的分离及估计效果.第五章,总结本文的主要研究成果,同时对ICA的发展进行了展望。
其他文献
本文主要讨论MMP(Mathematics Mechanization Platform)的系统结构及其高层编程语言实现与应用。MMP是由国家973项目资助的大型数学机械化平台软件,其核心功能是符号计算及其
在分子动力学模拟中,时间步长受限于被模拟分子中的键长伸缩和键角张合这类高频运动的周期。这使得分子动力学模拟的时间步长非常小,通常为1飞秒。约束动力学通过约束键长或键
图像盲去模糊问题就是在模糊核不清楚的前提下,由观察到的模糊图像复原出原始的清晰图像,这显然是一个病态问题。近年来,一些算法通过将图像和模糊核的各种先验信息融入到图像去
最小Steiner树(Steiner Minimal Tree,SMT)问题是一个非常经典和重要的组合优化问题,它寻求在某种距离意义下将给定的点用最短的网络连接起来。最小生成树(Minimal Spanning Tr
本文主要讨论仿射括号代数的算法和它在定理机器证明中的应用两方面的问题.   本文的动机有如下两个方面:   (1)括号代数作为一种崭新的定理机器证明工具已经被广泛研究
学位
本文在保结构思想指导下研究有限元方法。A.Bossavit和R.Hiptmair在电磁问题以及D.N.Arnold在弹性问题的研究是这个方面开创性的工作。在有限元离散化中,保持连续问题的恰当链
本文是关于紧黎曼曲面模空间的综述。   在本文中将会从几何的观点来叙述一些关于紧黎曼曲面模空间的基本知识。本文将会给出Teichmuller空间的一些等价定义,描述它的复结
在全面贯彻教育方针,落实素质教育,以提高学生身心素质为根本宗旨的今天,就素质教育重要内容的体育学科而言,在课程教学中,体现学生主体地位,充分发挥他们的参与积极性和运动
期刊
本文研究了两个从超对称场论出发得到的模型,Dirac调和映射与Dirac—Ginzburg—Landau泛函,主要分三个部分.   介绍了一些必要的预备知识后,在第二章介绍了超对称非线性σ模