论文部分内容阅读
喜树碱(Camptotheein,简写为CPT),是落叶乔木喜树(eamptotheein aeunate Denee)的根、皮、茎和种子中的一种提取物。它是拓扑异构酶I(ToP-I)的专属性抑制剂,通过与ToPo I-DNA可裂解复合物可逆结合,形成CPT-ToPo I-DNA三元复合物而抑制了DNA的解旋,导致癌细胞的死亡,因而具有高效的抗癌活性。系统地研究喜树碱分子结构上的变化对其抗癌活性的相关关系,构建出分子结构与其生物活性之间的定量相关模型,从而可为寻找新的高效安全的抗癌药物提供理论依据,因此本文研究是有意义的。 本文选取了47种具有抗癌活性的喜树碱类衍生物分子,采用HyPerchem7.0软件绘出其结构,并用分子力场中的MM+和PM3法对化合物进行几何优化,得到所有分子的较为准确的理论优势构型。在此基础上进行 AM1半经验量子化学计算。选取计算的量子化学参数都是与喜树碱类化合物药物活性相关的,包括核一核排斥能EHP、分子总能量Et、分子偶积矩D、最高占据分子轨道能级EHoMO、最低未占分子轨道能级ELuMO、二能级差DEHL、分子表面积S、分子体积V、正辛醇一水分配系数logP、摩尔折射率 MR、分子极化率 Pol,分子母环骨架各原子的净电荷Qi(I为原子序号)、取代基与母环相连第一个原子的净电荷,取代基的表面积SX,取代基的折射率MRX,取代基疏水常数logPx,取代基分子量MassX等。采用IC50倒数的负对数作为喜树碱类衍生物的药物活性参数,IC50是在足够的拓扑异构酶存在情况下使DNA裂解一半所需要的最小药物浓度。 在定量结构活性关系建模研究中,使用常规的逐步回归方法和新兴的计算方法,如径向基人工神经网络(RBF)和最小二乘支持向量机(LSSVM)等方法。 通过逐步回归分析,选择得出了logP、DIP O、ELUMO、DELH、Qdring等等五个因素变量与喜树碱类衍生物的药物活性有显著的相关关系,而且符合结构特异性药物发挥生物效应的共同特征模型。回归模型内外部检验合格,说明模型稳定,有较好的预测能力,揭示分子结构与其生物活性的相关关系,具有实际意义。 使用主成分-神经网络组合建模,即以主成分作为神经网络的输入。主成分分析方法对变量进行压缩,采用四个主成分,其方差贡献率达到96.064%,因此可以解释喜树碱类衍生物活性大部分信息。从径向基网络的预测能力看,网络训练预测误差几乎为0,而网络对独立检测集仿真预测略高。总体上看,径向基网络具有较好的数值逼近能力,预测准确性高。 将量子化学方法和支持向量回归(SVR)算法相结合,比较系统地总结了喜树碱类衍生物与其分子结构参数的关系。比较结果可以看出,支持向量机的预测性优于逐步回归和径向基人工神经网络。支持向量机方法属于“机器学习”方法,只要有若干学习样本,就可以利用支持向量机方法预测该类化合物的药效活性。本工作结果再次表明:即使对于线性相关的样本集,利用支持向量回归模型仍然能够得到推广能力更好的定量预报模型,支持向量机因其特有的建模优越性将越来越受到各学科领域的重视,具有很好的应用前景。