中医方剂数据挖掘关键算法的研究与应用

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:zyj16812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化的深入,中医作具有悠久历史的中华民族传统医学,在其几千年的临床实践和理论研究中积累了大量的方剂。中医方剂相关信息越来越多,如何从这些宝贵的数据库资源中找到有用的中医药知识,对现有的中医方剂进行分析,从而为中医专家研究方剂配伍提供相应的数据支持,是现代化中医方剂学急需解决的问题。鉴于此,本文结合中医方剂数据特点基础上,用数据挖掘的方法对方剂中治疗中风病和消渴病的药材配伍规律、药材用量和对应方剂信息的分析和研究,以便筛选出有效治疗上述症型的代表方。本文的主要工作如下:(1)数据预处理和方剂建模。现有的中医方剂古典书籍中对于不同的方剂名称、药材名称、用药量等记载不一,就给中医方剂数据统一性和完整性带来了障碍。因此在进行构建中医方剂数据库时必须对于原始数据采集进行标准化和规范化。(2)基于SO-Sets的频繁模式挖掘算法:在TB-Tree的基础上提出了 SO-Tree的数据结构,并在此基础上生成了 SO-Sets的编码形式。SO-Sets只需要对Start Order(或Finish Order)进行存储,大大提高了其空间效率。在基于SO-Sets的基础上,提出了一种挖掘中医方剂频繁模式的有效算法。此外,为了降低搜索的空间复杂度,算法中利用超级等价的性质进行剪枝。(3)基于带权无向图的Top-Rank-k频繁模式挖掘算法:为降低输入参数过大或过小对于中医方剂挖掘结果的影响,过滤掉1-项集和2-项集,直接挖掘出频繁k-项集(k≥3),从而提出一种基于带权无向图的中医方剂Top-Rank-k频繁模式挖掘算法;该算法可以在挖掘出满足条件的核心药物组合的同时并发现该核心药物组合做对应的方剂名,这为中医专家研究方剂配伍提供了数据支持;另外,该算法为提高算法的空间性能,采用了动态位向量机制对带权无向图中的权值进行了压缩存储。(4)基于WIdT-Tree的最大带权频繁模式挖掘算法:针对中医药材在不同的方剂中代表不同的价值和意义,定义了 dTidset概念,在dTidset的基础上对于WIT-Tree存储结构进行了改进和优化,提出了一种基于WIdT-Tree的最大带权频繁模式挖掘算法。同时,利用Diffset策略只需对部分频繁k-项集的带权支持度进行计算,对带权扩展支持度相等节点采取剪枝操作,从而减少了计算代价和搜索空间。在完成对于上述核心药物组合功效规律的分析后,根据上述核心药物组合的分析结果、方剂信息的分析以及用药量的分析,为脑中风和消渴病的方剂配伍规律的提供了重要数据支持,对丰富中医方剂学理论具有重要意义。
其他文献
随着近些年国家对城镇化的大力推进,大中型城市越来越多,大城市的“病症”也逐渐凸显。为了提供更好的出行方式和出行效率,全国各大重点城市都在兴建或拟建轨道交通项目。虽
背景:肝细胞癌在我国是最多见的恶性肿瘤之一,每年发病人数居我国新发肿瘤第四位,死亡率居我国第三位,术后易复发转移。因此,探索肝癌的发生发展及转移复发的相关因素,寻找早
本课题针对南方某地区红壤中接地网腐蚀状况进行了调查取样,以变电站0.8m深处土壤为介质,采用控温保湿的加速方式对接地网常用材料Q235进行腐蚀加速实验以及现场埋片实验,运
中国人口老龄化进程正在日益加剧。伴随着人口结构和家庭结构的改变,中国正经历着巨大的社会变革。老龄人口数量的快速增长、预期寿命的延长与老年人收人水平的逐年提高对养老服务体系提出了更高的要求。随着大规模兴建机构养老的热情逐渐消退,居家养老、社区养老等养老模式逐渐回归。在国家、家庭、社会组织、企业等社会各方面力量开始共同承担养老服务供给的大环境下,符合我国国情的,以居家为基础、社区为依托、机构为补充、医
本文以MODIS逐日地表反射率产品(MOD15A2H,500m分辨率的8天复合数据集)为基础,利用空间分析、趋势分析、相关性分析等方法,研究了新疆2000-2018年的LAI数据,探讨近19年LAI的动态变化及驱动因素影响。同时进一步分析植被密度的大小与蒸散量的定量关系,研究近19年以来MODIS16产品提取的地表ET时空分布特征及变化趋势,并探究LAI与ET、DEM、气温、降水量之间的相关性。通
目的构建恶性黑色素裸鼠移植瘤模型,利用前期课题组制备的Ang2-siRNA质粒壳聚糖磁性纳米微粒,经尾静脉将该微粒注射入荷瘤裸鼠体内,先观察Ang2-siRNA质粒壳聚糖磁性纳米微粒
目的:对鞘翅目Coleoptera金龟子科Scarabaeidae昆虫蜣螂Geotrupidae干燥全体的70%乙醇提取物中碱性部分含氮化学成分进行分离纯化,并对其结构进行鉴定。方法:综合运用RP-18、
构式语法是认知语言学研究中一种新的理论模型,自上世纪八十年代兴起,至今已取得了很大的发展。其创始人Goldberg认为,构式作为语言的基本单位,是形式与意义的配对。Goldberg
研究目的:广东省U-16女足这支队伍主要任务是参加第十四届全运会,本文通过对广东省U-16女子足球运动员备战期两个训练阶段身体机能指标变化进行监测分析,通过运动员机能指标变化情况来判断训练负荷量和强度安排是否合理以及这一阶段训练负荷安排是否达到了教练员的要求,了解备战期运动员身体机能状态,从而为教练员调整训练负荷制定训练计划提供参考依据。研究方法:本文以广东省备战第十四届全运会女子U-16年龄段1
轮对和钢轨之间的相互作用是轨道车辆运动的显著特点之一,尤其是在车辆经过曲线的过程中,轮轨之间的作用力和磨损也相应的增加,因此有必要研究轮轨相互作用的的磨损关系,为进