有限正态混合模型的参数估计与应用

来源 :南开大学 | 被引量 : 0次 | 上传用户:biantaitai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合模型的历史可以追溯到约100年前的K.Pearson时代.第一篇关于混合模型的论文是K.Pearson(1894)用矩估计方法来估计如下两成分正态混合模型的参数:f(x,π,θ1,θ2,σ1,σ2)=πψ(x;θ1,σ12)+(1-π)ψ(x;θ2,σ22).对于上述模型的5个独立参数,Pearson给出了5个矩方程,然后通过求解这个方程组,得到参数的估计值. 有限正态混合模型无疑是最重要的一类混合模型.几乎可以说,正态混合模型的发展历史其实也就是混合模型的发展历史.比较有趣的是,关于正态混合模型,一个最基本的统计问题,即如何估计模型中的参数,一直未得到圆满的解决. Pearson(1894)提出的矩方法需要求解非线性方程组,并且模型的阶数(成分数)越高,方程组越复杂,计算上非常困难.随后的理论研究更指出,从渐近性质来看,矩估计不如极大似然估计. 但Day(1969)指出正态混合分布的似然函数无界,这为极大似然方法的应用投下了阴影.到目前为止,统计学家通过对参数空间添加约束,使得似然函数在约束的参数空间上有界,来对付Day(1969)指出的问题.但这些方法在应用时并不能保证约束后的参数空间一定包含参数真值. 我们将用基于惩罚似然函数的方法讨论正态混合模型的参数估计.不改变参数空间,而是通过对似然函数添加一个惩罚项,来消除似然函数无界性的影响,从本质上避免了约束参数空间方法的不足.但如何找到合适的惩罚项,并证明所得的惩罚最大似然估计(PMLE)有理想的性质,则一直没有进展.Ciupercaetal.(2003)声称找到了合适的惩罚函数,并能证明所得的PMLE的强一致性以及渐近正态性.但我们发现,他们的证明中有本质的错误. 通过分析Day(1969)指出的似然函数无界的现象,我们发现,理解这个问题的关键在于估计当σ很小时, supθ#{i:0<Xi-θ<|σlog(σ)|}的大小.我们证明了,在一个与σ无关的零测集外,当n→∞时,总有supθ#{i:0<Xi-θ<|σlog(σ)|}≤{4(logn)2,8+8Mnσ|logσ|,0<σ≤8/nM,8/nM<σ<ε0.其中M,∈0是正常数.这是本论文第一个主要结果.在这个估计的基础上,我们证明了,当惩罚项p(G)=-n-α(p∑κ=11/σ2κ),α∈(0,1]时,惩罚似然函数的最大值点(PMLE)是模型参数的强一致估计,也是渐近正态估计,并且渐近效率为1.这是本论文第二个重要结果,据我们所知,这是一个首创性的结果.我们进一步发现,在supθ#{i:0<Xi-θ<|σlog(σ)|}的估计的基础上,我们可以判别什么样的惩罚函数是合适的,从而可以设计出新的惩罚函数.作为特例,我们提出了如下的惩罚函数:p(G)=-n-α(p∑κ=11/σ2κ)(p∑κ=1σ2κ),α∈(0,1]这个惩罚函数下得到的PMLE不但仍有强一致性以及渐近正态性(渐近效率为1),而且还是位置尺度变换下的同变估计.这是本论文第三个主要结果.正态混合模型的应用非常广泛,我们相信,本论文的理论成果将有巨大的应用潜力.作为示例,我们分析了一组来自分子生物试验的数据.
其他文献
我国经济的高速发展推动了我国城镇化建设,城市的楼层随着人口密度的增加越来越高,其楼层规模也是越来越大,高层建筑的智能化系统设计成为了各个建筑企业重点研究的课题之一
本文提出了一个几何约束求解的新算法:偶图DM-分解法。这种方法首先将一个几何约束系统分解成一些具有某种偏序的较小的几何约束系统,然后按偏序关系给出一个构造序列,从而降低
多项式循环码是一类特殊的线性码,因其具有丰富的代数结构和相对简单的译码算法,近几年得到编码学者广泛的关注与研究.循环码、负循环码和常循环码都是多项式循环码的重要子类.
边界条件识别反问题属于数学物理反问题的一类经典问题,它广泛存在于理论研究和工业应用中。各向异性材料是一种新型材料,它具有热传导系数随方向改变的特性,现代科技迅速发展,对
本文主要研究了一类两自由度碰撞振动系统的周期碰撞运动,借助理论分析和数值仿真的方法对系统单碰周期n运动的存在性与共存性等性质进行了研究,并推导出能描述系统运动过程的
近年来,我国土地资源的使用现状严峻,国家迫切要求各省市尽快实现土地资源的可持续利用。土地资源一般指能够供养生物的陆地表层,包括内陆水域但排除海域在内,是人类生存发展的前
随着转录组和表观遗传学的发展,RNA在生命活动中扮演角色的重要性不断被科学家证实。通过对RNA结构的相似性分析,可以实现RNA分类,进而可以帮助我们了解RNA的一些生物功能。
行业的经济走势一直是政府和企业关注的焦点,及时了解趋势变化,就能趋利避害,掌握经济决策的主动权为企业赢得利益.因此,对某行业的某些重要指标建立起预测模型,就显得非常重
  客户关系管理(CRM)解决方案是企业的一项有效竞争策略,能使企业完整掌握客户信息,了解客户需求。常旅客系统的航空公司客户关系管理解决方案的重要组成组成部分,本文以航空
黎曼是19世纪最伟大的数学家之一,他的几何思想不仅是19世纪最精彩的思想,也是融合了数学、物理和哲学的典范。研究伟大思想的产生和发展不仅具有深刻的历史意义,而且对当今数学