论文部分内容阅读
在大数据时代,我们经常会遇到很多高维数据方面的问题,这些问题一般都具有维数p和样本容量n都很大的特征,通常也被称为“大p、大n问题.传统的多元统计分析可以很好地解决维数p很小或者是固定情况下的问题,例如经典的卡方逼近方法,似然比检验方法等,但随着维数p的增加,这些方法不能很好地解决问题甚至失效.因此,寻找一些能够解决高维问题的新方法是非常有意义的。 本研究主要考虑了维数p和样本容量n都很大的两个模型的高维假设检验问题。首先考虑的是具有循环对称协方差结构的高维假设检验.在两种稍有不同的假设下,利用矩母函数的连续性定理,通过伽马函数的渐近展开,证明了在正态总体下,当原假设成立时,似然比统计量依分布收敛于一个正态分布的随机变量,然后将提出的的高维似然比检验方法(HLRT)同卡方逼近方法(BOX)、高维edgeworth展开方法(HEE)以及更精确的高维edgeworth展开方法(AHEE)进行数据模拟,结果表明本文提出的HLRT方法优于BOX方法和HEE方法,并且和AHEE方法在处理高维数据方面一样好。研究高维主成分分析中最小特征值等价性的似然比检验.在原假设以及正态总体的假定下,利用特征函数的连续性定理和类似的展开方法,得到了对数形式的似然比统计量服从正态分布。数值模拟揭示了本文提出的正态逼近方法(HLRT)和更精确的高维渐近展开方法(AHAE)—样好,并且在维数p增加的过程中,它们两个方法都比卡方逼近方法(Lawley)的结果要准确。