论文部分内容阅读
高血压是当前影响居民健康水平的一种主要慢性病,针对高血压有关酶系研究特异性药物成为当今的热门研究方向,其中血管紧张素转移酶(ACE)就是一个重要的研究靶点。ACE的结构信息目前已经被大量的研究,针对ACE的结构特征,寻找能与其特异性结合的小分子作为抑制剂在未来的新药研发中具有良好的应用前景。通过分子对接软件使用高通量虚拟筛选方法可以获得大量的ACE酶与小分子配体的结合的结构信息,但对于未知的配体,这种结合是否具有活性是无法判断的。本项研究中,首先评估AutoDock与Auto Dock Vina这两个对接软件能否将有活性与无活性对接结果进行区分,研究发现对于大部分受体,这两个软件的区分效果并不好。为了寻找能够对蛋白-配体结合效果进行评估的方法,我们对深度学习方法进行了探索。深度学习方法最近在图像识别,自然语言处理等众多领域有着广泛应用,并取得了很好的效果,本项研究的思路就是来源于图像识别。可以将大量已知结合效果的配体与ACE的结合构象作为输入向量,对应的结合效果作为输出向量来训练神经网络,神经网络从结构与对接结果之间自动学习其相关规律,从而达到能对未知配体的结合效果进行预测的效果。本次研究中分别使用了AutoDock和AutoDock Vina的对接结果对深度神经网络与卷积神经网络进行训练和评估,寻找预测效果最好的神经网络层数设置。研究发现,不同的对接软件生成的对接结构对与神经网络的训练并没有明显影响,对于深度神经网络来说,最佳层数设置是只有1层隐藏层,隐藏层节点数是480,再此条件下神经网络对测试集的预测准确率在85%~90%之间;卷积神经网络的预测效果要优于深度神经网络,它对测试集最好的预测准确率在95%~98%之间,此时的层数设置为2个卷积层,每个卷积层后面接1个池化层,然后再接一个5层的全连接层。深度学习方法对于未知配体对蛋白受体的结合效果具有很高的预测准确率,在未来新药开发等领域具有很好的应用前景。