论文部分内容阅读
目的:纵向数据是医学研究中常见的一种类型,在一些研究中,研究对象接受治疗后的发展轨迹可能不是来自同一总体的,即变化轨迹存在异质性。增长混合模型是纵向数据中识别总体变化轨迹异质性的一种统计方法,但是,在正确识别异质发展轨迹方面,三类枚举指标(信息指标、熵指数及衍生指标、似然比检验衍生指标)的性能特征却鲜为人知,尽管有少数模拟研究进行了探讨,但仅限于线性增长混合模型,本研究旨在探讨在同质总体(k=1)和异质总体(k=3)的情况下,三类枚举指标在二次增长混合模型中正确识别潜在类别的性能。本研究以丹红注射液治疗冠心病病人的中医证候为实例,探讨临床试验中医证候纵向数据发展的阶段性(干预期与随访期)和异质性,以期找到对试验药物敏感的目标人群。方法:针对三类枚举指标在增长混合模型中的性能,本研究的模拟设置如下:对于k=1的同质性总体模型,只考虑了样本大小和观测时间点两个因素;对于真实类别k=3的异质性总体,考虑了5个可能影响枚举指标的因素:样本量大小、类别距离、类别的比例、轨迹增长形态、观测时间点数量,采用Mplus软件生成并分析模拟数据。针对临床试验纵向数据发展的阶段性和异质性,本研究以丹红注射液临床试验的918例慢性心绞痛患者的中医疗效积分(TCMS)的6次随访(0、7、14、30、60、90天)数据为例,采用多阶段混合增长模型,探讨纵向数据发展轨迹的不连续性和潜在类别;同时采用多分类logistic回归模型探讨协变量对潜在类别的预测效应。结果:本研究结果主要如下:(1)枚举指标对增长混合模型的识别对于同质性总体,模拟结果表明:(1)对于所有信息指标以及样本调整的信息指标,当n=300,时间点数为4时,所有的信息指标可以100%的选择最佳模型;(2)在似然比检验的衍生指标中,BLRT最能识别所设置的研究模型,但表现不及CAIC,BIC,D-BIC以及HQ;(3)除了HT-AIC外,对信息指标进行的样本调整总体上降低了它们识别正确模型的百分比。对于异质性总体,模拟结果表明:(1)在类别间距离较小的情况下,几乎所有指标在识别潜在类的正确数量方面都表现得很差,存在类别提取不足的情况,在本研究中表现为偏好选择C=2的模型;(2)HQ整体表现最好,其次是aCAIC和aBIC,但在类别间距离较大的情况下,BIC、CAIC的表现略好于aCAIC和aBIC;(3)整体来看,除了D-BIC和HQ之外,与未调整的信息指标相比,样本量调整后的信息指标总体显示出更高的模型恢复率,但是这种差异是相对比较小的;(4)以往不太关注的一些指标表现令人惊喜,例如D-BIC和HQ,在类别高分离的条件下,其表现丝毫不逊于BIC和CAIC;(5)熵在任何条件下都不值得推荐,但ICL_BIC表现优异;(6)在基于似然比检验的指标中,BLRT表现最佳。(2)心绞痛患者中医疗效积分发展轨迹的异质性和阶段性918例慢性心绞痛患者的TCMS评分的发展轨迹可划分为四个潜在类别,分别是C1平稳下降组(63.18%)、C2中等下降组(9.91%)、C3快速下降组(10.02%)、C4缓慢下降组(16.89%)。慢性心绞痛患者的TCMS评分整体上在治疗期随时间呈下降趋势,随访期逐渐趋于水平。4个组别的TCMS评分的发展轨迹均具有显著的时间效应:在治疗期(0-14天),C1组(斜率:-0.526)和C2组(斜率:-0.594)的TCMS评分呈现出平稳地下降趋势,C3组(斜率:-1.582)快速下降,C4组(斜率:-0.237)缓慢下降;在随访期(14-90天),C1组(斜率:-0.025)和C3组(斜率:-0.025)平稳下降,C2组(斜率:-0.136)快速下降,C4组(斜率:-0.014)缓慢下降;随访期TCMS评分的变化速率低于治疗期。治疗组别(<0.0001)、发病时间(=0.0158)、基线SAQ评分(<0.0001)是预测研究对象发展轨迹分类的重要因素。结论:模拟研究表明,不论是异质性总体还是同质性总体,BIC、CAIC、aCAIC被证明是识别增长混合模型潜在类别高度可靠的指标;此外,ICL_BIC、D-BIC在异质性总体中表现不俗;相比之下,AIC、熵、CLC被证明是数据中识别潜在类别真实数量不可靠的指标。实例分析表明,两阶段线性混合增长模型可以有效拟合慢性心绞痛患者TCMS评分发展趋势的异质性和阶段性,接受治疗的第14天为节点,发展轨迹分为四类,绝大多数的受试者属于基线病情程度较轻,治疗期内病情缓慢缓解,随访期内病情保持稳定的状态。