论文部分内容阅读
目的:对收集的结核病患病资料,利用不同的统计模型对资料进行拟合分析,探讨结核病患病的影响因素,为结核病的防治提供线索和依据;分析和比较不同的回归模型对资料的拟合程度和效果。通过本研究,为今后在公共卫生领域相关研究中所收集的类似具有聚集性特征的数据资料分析,提供一些分析的借鉴方法和线索。方法:本研究利用防治艾滋病、病毒性肝炎和结核病等重大传染病规模化现场流行病学和干预研究项目中的调查研究成果,收集和整理2009-2012年浙江省13个结核病防治示范区中有关结核病患病的专项数据资料,资料内容主要包括地区因素、性别因素、年龄因素和结核病患病情况。根据不同统计模型适用的资料类型和条件不同,在模型拟合分析前,对数据分别进行整理和重新编码。采用不同的统计模型,对资料进行拟合分析。主要涉及的回归模型包括:Logistic回归模型、Probit回归模型、Poisson回归模型、负二项回归模型、多水平Poisson回归模型、调整过离散的多水平Poisson回归模型和多水平负二项回归模型等,通过拟合不同的模型,分析和了解地区因素、性别因素和年龄因素等因素对结核患病的影响,同时对不同统计模型的拟合情况进行比较。本研究对资料的整理和编码采用了Excel2007和SAS9.2,模型拟合和参数估计采用了SAS9.2统计分析软件。结果:拟合的所有7个统计模型的结果都显示,地区因素、性别因素和年龄因素对结核病的患病都有影响。Logistic回归模型、Probit回归模型、Poisson回归模型和负二项回归模型都提示,本资料中相对于A类地区人群,C类地区和B类地区人群地区因素都是危险因素,OR值都大于2;男性人群与女性人群之间结核患病率差异有统计学意义,OR值大于2,即男性人群患结核病的相对危险度是女性人群的2倍以上;≥50岁与<50岁人群结核患病率差异有统计学意义,OR值大于2,即≥50岁人群患结核病的相对危险度是<50岁人群的2倍以上。拟合的前6种统计模型虽然部分处理了离散的情况,但结果显示6个模型中Pearson卡方值与自由度之比最小为4.44,该值大于1,说明资料存在过离散现象,分析时需要处理离散问题。而多水平负二项回归模型的Pearson卡方值与自由度之比1.02,接近于理想的值1,较好地解决了残差的过离散问题。通过模型间比较发现,多水平模型尤其是多水平负二项回归模型比单水平模型要更适合本资料的拟合。结论:统计分析提示地区因素、性别因素和年龄因素对结核病患病有影响,可以针对性地制定相应措施和政策,提高结核病防治效率;不同统计模型比较结果提示,多水平模型对具有聚集性、嵌套性资料的拟合效果优于单水平模型,并且也可以很好地处理资料存在的过离散问题。