【摘 要】
:
随着科学技术的发展,我国正处在医疗数据信息化的高速发展阶段。医疗数据的指数式增长及医疗平台的发展,使得医疗数据的获取日益便捷,但隐藏在海量医疗数据中的有效信息并没
论文部分内容阅读
随着科学技术的发展,我国正处在医疗数据信息化的高速发展阶段。医疗数据的指数式增长及医疗平台的发展,使得医疗数据的获取日益便捷,但隐藏在海量医疗数据中的有效信息并没有得到充分的挖掘和有效利用,如何从医疗数据中挖掘出隐含的有用信息,从而对医生的诊断提供辅助具有现实意义。针对医疗数据不平衡问题和疾病建模预测问题,论文运用数据挖掘的知识,对医疗数据建立预测模型,为医生诊断病情提供参考。论文在数据层面,针对医疗数据中存在的数据不平衡问题,提出一种数据不平衡处理算法KE-SMOTE。KE-SMOTE算法对于数据集中的多数类样本,首先进行多次聚类,直至聚类最小误差不再变小或者达到指定的迭代次数,然后采用聚类融合的方法进行欠采样;对于数据集中的少数类样本,采用smote算法进行过采样,将得到的新的多数类样本和新的少数类样本结合,得到新的训练数据集。论文采用UCI数据集进行实验,实验证明KE-SMOTE算法相较于传统的类别不平衡处理算法,具有更好的效果。在算法层面,论文提出一种基于自编码器的深度置信网络算法AE-DBN,用于对医疗数据进行建模预测。AE-DBN算法采用自编码器对数据集进行特征抽取,将抽取得到的特征与原特征集结合,运用深度置信网络建立模型,通过调节隐藏层层数和结点数量,构造最优深度置信网络模型。论文采用某医院提供的高尿酸血症医疗数据集进行实验,通过与传统的机器学习算法进行对比实验,证明了AE-DBN算法具有更高的分类准确率。同时通过对数据集中指标的数据分析和组合不同特征进行建模实验,得出了影响高尿酸血症的患病因素,可以为医生诊断高尿酸血症提供参考。
其他文献
为解决注塑机螺杆表面的磨损、腐蚀等失效,更大范围调配涂层的成分、组织、性能,并将涂层的应用拓展到轧辊、曲轴、刀模具等零部件中。本文利用激光合金化技术在45钢表面制备了铬/钼/硼系列合金化涂层,并优化了合金化涂层的成分配比及相应的合金化工艺,提出了成分选用与合金化涂层性能的对应关系,为不同的工程要求提供相应的涂层成分和工艺。结论如下:(1)优化制备了Cr_3Mo_7B_x、Mo_1B_9Cr_x、C
群体感应(Quorum sensing,QS)是细菌通过信号分子的分泌、扩散及识别,调控群体行为的交流机制。为防止群体合作被欺骗者入侵,细菌进化出包括谨慎代谢、亲缘选择、代谢限制、毒素监管等多种稳定抑制欺骗者的机制。虽然有关毒素监管机制的研究已取得一定进展,但其监管作用规律以及合作者如何在释放毒素物质的同时进行自我保护等问题尚未探明。基于此,本文就上述问题展开了研究,并取得如下主要结果:(1)通过
基于磁耦合原理的无线电能传输(Magnetic Coupled Wireless Power Transfer,M-WPT)技术是以电磁感应定律为原理的一门新兴技术,因其安全、便捷、美观、可靠等特点得到广泛的
低电压穿越(Low voltage ride through,LVRT)能力已经成为大型风电场并网基本原则的要求之一。双馈感应风力发电机以其造价低、重量轻、调速范围宽和高可控性等优点,已成为当
乌干达银行业对乌干达社会的发展至关重要,但是在20世纪90年代至21世纪初,乌干达银行业曾遭受严重打击,其中有8家商业银行宣告破产。而给乌干达银行业造成上述困境的最主要原因便是公司内部治理不善。在此之后,乌干达银行就内部治理存在的问题采取了一系列措施,显著促进了银行经营业绩的提高。但是,银行业面临的风险,如操作风险、信用风险、市场风险、利率风险等,仍然使其面临着巨大挑战。由于银行风险管理的策略只有
社会救助制度是一个国家社会保障制度中具有非常意义的部分,其具体作用一方面是保障生活困难人民最基本的生存权利和基本权益,另一方面可以缓解社会阶层矛盾,积极推动社会各方稳定和谐发展。新时期,中国社会发展进入决胜全面建成小康社会的关键时期,经济社会改革进入深水区,因此建国以来,我国实行的社会救助体系也应随着时代变迁而做出深刻调整。本文以山东省济宁市政府社会救助工作绩效评估为研究对象,综合运用社会救助制度
本文是一篇翻译实践报告。翻译报告实践的原文是《大学翻转课堂》一书,该书是基于2014年教育通信技术协会会议上参会人员发表的研究和观点编撰而成的。译者选取了报告原文的
语言不仅是我们重要的交际工具,也是我国传统文化最重要的载体。小学阶段是教育的基础阶段,也是儿童学好语言的关键时期,为儿童一生的发展奠定基础。随着网络的普及以及新课程改革的逐步发展,小学生语言学习的来源日益广泛,他们接受的是来自各个方面的纷繁复杂的信息和知识,其中包括当下最流行的网络语言。2019年3月12日的全国第十三届人民代表大会二次会议上,教育部部长陈宝生曾表示,“不减负,学生不高兴;学生不高
本文是在国家自然科学基金(项目编号:71673032)的资助下完成的。社交网络的高速发展极大地影响着互联网数据的产生,人们通过互联网分享自己的观点或体验,表达了各种情感倾向,
软件演化是一个软件系统不断调节变化从而满足开发需求的过程,演化的过程在整个软件生命周期中都会出现。软件需求的变更、算法的使用、运行环境的改变、功能的加强或删除等