论文部分内容阅读
目的:随着数据挖掘技术的迅猛发展,人们对中医药临床疗效评价和新药研究开发等做出了许多创新性的尝试,如证候分类研究。证候是通过望、闻、问、切四诊所获知的信息,这些数据一方面提供了极其丰富、详细的信息,但是另一方面这种高维度、稀疏分类数据对其统计分析带来了前所未有的困难。本项研究针对上述问题,采用潜在类别回归分析(regression of latent class analysis,RLCA)进行中医证候分类研究,为分类数据降维和中医药证候研究提供参考。 内容:在介绍潜在类别回归分析方法的原理基础上,通过实际数据验证其特点、适用性和有效性;通过古代医案数据、临床试验数据、中药治疗传染病和皮炎实际数据,多角度阐述RLCA模型在中医证候分类中的实用性,并给出RLCA在中医证候分类中的分析步骤。 方法:使用SAS软件进行潜在类别回归分析,首先建立初始潜在类别模型(latent class analysis,LCA);逐步增加类别数目,通过G2、BIC、AIC等指标选择最优基线模型;加入中医辨证时的影响因素作为协变量,校正基线模型参数、建立潜在类别回归模型;通过条件概率对类别的命名与参数估计结果进行整理;利用贝叶斯理论对受试者进行分类,决定归属类别。 结果:主要研究结果如下: LCA能够提取望、闻、问、切四诊中的相关信息,并具有较好的处理多分类变量的能力,但分类效果往往没有考虑到中医辨证过程中相关的混杂因素,从而导致部分分类效果很难解释。 RLCA克服了传统多元统计方法在处理具有多分类性、数据稀疏性、变量之间存在多重共线性的四诊信息变量时的不足。RLCA方法结合logistic回归分析用于中医证候分类研究,一方面可以提取四诊中的相关信息,另一方面可以研究混杂因素对潜在类别的影响。 给出了基于潜在类别回归分析方法在中医证候分类研究中分析的基本步骤,并通过对五项中医实际数据的分析,显示了RLCA具有较强的处理多分类、稀疏、多重相关的四诊信息能力。 根据中医辨证论治理论,并结合中医临床大夫经验对四诊信息进行人工筛选;RLCA考虑了辨证过程中的混杂因素,更加接近中医临床实际的诊疗过程,获得的分类结果为临床疗效评价和中医药标准化研究提供了参考方法。 结论:中医对疾病的诊断主要是以证候理论为基础的证候分类理论,中医疗效评价必须以证候分类诊断标准为基础。本研究基于潜在类别回归分析方法,考虑了混杂因素在证候分类中的作用,同时利用贝叶斯原理对纳入患者进行特征归类,为确定相应中医药干预措施的最佳适应症提供了参考标准。