论文部分内容阅读
中药方剂配伍规律发现问题是方剂理论及中医药客观化研究的重要问题之一,是中药方剂研究者及计算机工作者尤其是数据挖掘研究者普遍关心的热点问题之一。目前利用数据挖掘技术探索方剂配伍规律的研究主要基于分类、聚类和关联规则挖掘,已经有了很多的研究成果,不过此类研究一般都没有显式分析“药-药”、“方-方”之间的关系。本文着眼于方剂中的若干“关系”,尝试从复杂网络社团发现的角度研究中药方剂网络模型,从而探索方剂配伍规律,本文的主要工作有: 1)针对中药方剂的“属性-值”的描述结构,提出了以药物为结点构建中医药方剂(TCMF)网络的三种方法,分别是基于药物关联的TCMF网络构建方法、基于药物出现贡献度的TCMF网络构建方法和基于药物同方率的TCMF网络构建方法,在此基础上分析了TCMF网络区别于传统复杂网络的主要特点; 2)针对TCMF网络的特点,提出了三种高重叠的社区发现算法,分别是改进COPRA算法、极大团生长(MAIGA)算法和共近邻相似三元组凝聚(COSTMA)算法,其中MAIGA算法和COSTMA算法在凝聚的过程中通过不同的参数设置还能划分出药群社区层次结构,实验结果表明了算法的合理性和有效性; 3)针对传统方剂聚类算法的方剂或药物单分配的不足之处,提出基于TCMF网络社区发现的层次网络聚类算法,该算法通过计算TCMF网络社区发现的结果和方剂之间的相似度,把方剂重叠聚类从而挖掘方剂与方剂之间的关系,实验结果表明算法能弥补传统方剂聚类算法的不足,能够较全面的覆盖药物结点。