论文部分内容阅读
目的通过比较倾向评分(Propensity Score, PS)回归法与传统logistic回归法处理多重共线性资料结果的差异,探讨PS回归法处理多重共线性资料的统计性质及其应用特点。方法采用蒙特卡罗(Monte Carlo, MC)模拟法,分别从样本量、协变量与暴露变量相关性以及结局变量阳性率三个因素的不同水平进行模拟研究,比较PS回归法与logistic回归法在处理多重共线性资料的差异,同时探讨了三个因素间的相互影响,并用实例对上述模拟结果予以验证,进一步阐明倾向评分回归法处理多重共线性资料的可行性和实用性。结果(1)当固定结局变量阳性率(4%),协变量与暴露因素相关性较高(r=0.92)时,PS回归的回归系数较logistic回归更接近标准模型的估计值,但是,随着样本量的增加,回归系数的估计逐渐趋于一致,而且估计误差会越来越小。(2)当样本量固定,PS回归计算的回归系数随着协变量与暴露因素相关性的变化与标准模型变化趋势一致,两模型回归系数之差并不随相关性的增加而变大,而logistic回归估计的回归系数以及标准误在一定相关性(1=1000,r>0.5;n=500,r>0.3)后就开始增大并远离标准值。同时,与一般1ogistic回归模型相比,PS回归法在样本量较小的资料中对共线性处理的优势更为明显。(3)当样本量固定,协变量与暴露因素相关性较高(r=0.92)时,与logistic回归相比,PS回归的回归系数及标准误与标准模型较为接近,但这种优势随着阳性率的增加而逐步变小。结论基于本研究的结果,我们认为在处理具有多重共线性的数据时,PS回归的参数估计较logistic回归的参数估计更为可靠,特别是在样本量小、结局变量阳性率较低、变量间共线性较高条件下更应考虑使用PS回归以避免参数估计的偏倚。