【摘 要】
:
随着计算机技术的飞速发展,机器学习在医疗领域的作用得到了人们的广泛关注。一直以来,在乳腺癌治疗和预后过程中,医生的临床经验起着决定性的作用。然而,经验的积累需要大量的临床实践,由于数据量每年以指数形式增长,人工处理数据来发现规律费时费力且满足不了要求,为了提高临床医生诊断的准确率和效率,因此必须通过计算机使用更高效的算法进行处理和挖掘数据。本文数据来自真实世界的1995年至2000年间3088名乳
论文部分内容阅读
随着计算机技术的飞速发展,机器学习在医疗领域的作用得到了人们的广泛关注。一直以来,在乳腺癌治疗和预后过程中,医生的临床经验起着决定性的作用。然而,经验的积累需要大量的临床实践,由于数据量每年以指数形式增长,人工处理数据来发现规律费时费力且满足不了要求,为了提高临床医生诊断的准确率和效率,因此必须通过计算机使用更高效的算法进行处理和挖掘数据。本文数据来自真实世界的1995年至2000年间3088名乳腺癌女性患者的随访数据。进行了以下研究:(1)本文针对医疗数据普遍具有不平衡的特点提出了双重加权的贝叶斯算法。首先在公共数据集上进行验证;其次基于来自真实世界的乳腺癌患者随访数据,使用双重加权的贝叶斯算法和朴素贝叶斯算法对患者的复发时间进行预测,结果表明在对乳腺患者的复发时间预测上相对于朴素贝叶斯算法均有所提高。(2)本文乳腺癌患者数据,进行处理平衡数据;采用K近邻、支持向量机、决策树和深度前馈网络四种机器学习算法分别构造多分类学习器进行实验;接着采用集成学习,并且与Bagging算法以及Adaboost算法形成对比;充分说明投票法的集成学习可提升单一机器学习在癌症医学数据的分类效果。在三种集成学习算法中Ada Boost算法在乳腺癌患者的随访数据的分类效果上表现最优。本文以此为基础建立可靠、稳定的乳腺癌患者的复发时间预测模型。(3)本文选取进行了保乳术手术的雌激素受体阳性患者为研究群体,通过生存分析中的KM法探究内分泌治疗对患者的复发获益情况;使用逆向概率倾向评分加权的Cox多因素风险模型对乳腺癌患者进行分析,得到患者的复发独立影响因素,根据这复发独立影响因素建立列线图模型,该模型具有较好的准确率和区分度,从而对患者的三年、五年以及十年的无病生存率进行可视化预测。本文针对医疗数据提出的双重加权的贝叶斯算法在对不平衡数据进行分类时相对于朴素贝叶斯算法分类预测效果有大幅度提升,建立的机器学习模型对乳腺癌患者的复发时间预测具有一定的临床使用价值;根据生存分析情况可以使肿瘤核级别为III的患者避免治疗不足导致复发和肿瘤核级别为I、II的患者治疗过度造成损害;根据患者的复发独立影响因素建立的列线图模型,在临床治疗和预后中,该模型为临床医生提供了精准医学和个性化治疗的决策支持,可以使患者通过早期干预从复发预测中受益,对临床医学具有一定的指导和借鉴意义。
其他文献
智能纺织品在个人体温管理、可穿戴人体运动监测和医疗保健等方面的潜在应用受到越来越多的关注。由于纺织品固有的亲水性导致纺织品易被污染,给实际使用带来很多不便。同时,柔性可穿戴纺织品在实际使用中容易受到机械和微生物的攻击,如出汗、磨损、弯曲、细菌交叉感染等。因此,如何制备具有防水、电热响应、机械敏感和抗菌性能的多功能电子纺织品仍是一个挑战。本文对多功能电子纺织品的研究进展进行综述和分析,以具有柔软、透
碳量子点(CQDs)作为一种新型荧光纳米材料受到广泛的关注。由于其具有水溶性好、毒性低、制备简单以及独特的光学性质被广泛地应用在生物/化学传感器、光催化和细胞成像等领域。鉴于CQDs在紫外光区具有很强的吸收能力,因此可用作棉织物防紫外线整理剂。本文采用水热合成法合成了三种不同碳源的硼氮共掺杂碳量子点(BN-CQDs),表征了所制备BN-CQDs的结构和光学性质,并通过表面喷涂-碾轧和棉织物纤维素改
水玻璃砂是最环保的型砂之一,在铸造型砂中,水玻璃砂最有可能实现无公害化,符合21世纪对环保绿色生产制造的需求。在传统的型砂铸造工艺中,复杂模具设计加工工艺流程比较复杂、产品的研发周期长,企业的生产成本高。随着微波装备和三维打印的快速发展,微波无模硬化水玻璃砂工艺实际应用已成为可能。三维打印-微波硬化打印原理是:铺平一层一层的原砂,使用液态水玻璃作为粘结剂并通过喷嘴一层一层的粘结原砂,然后微波硬化。
提升黄河流域城市能源利用效率既有助于实现"碳达峰"和"碳中和",又有助于黄河流域生态保护和高质量发展。基于非径向方向性距离函数、非径向Luenberger指数及分解项、Tobit模型探讨了2003-2018年黄河流域城市能源利用效率的时空特征、内生驱动机制与外部影响因素。研究发现:2003-2018年间黄河流域城市能源利用效率整体上表现出波动上升态势,且能源利用效率的增长主要来自能源经济效率的改进
针对现有针织机械,难以进行大幅度的效率提升的问题,本文打破传统针织机械的织针驱动原理的限制,提出了一种新型电磁阵列式的混合磁悬浮织针驱动方法,通过测量织针的上升高度,实时的控制并改变电磁线圈加载的电流大小、方向和机头的横向位移,进而使织针能根据设定的编织工艺动作。本文通过研究电磁线圈和永磁铷铁硼的空间磁场分布规律,分析永磁织针与电磁线圈的混合磁悬浮驱动系统中永磁织针运动高度与电磁力的关系,获得永磁
随着时代的进步,纺织材料与纺织技术发展迅速,纺织品不仅仅局限于服装和装饰,各种功能性需求也随之而来。非织造布作为纺织产品中的一个大类,市场占比逐年增加,高速发展的非织造产业也凸显出来一些问题,由于产品大多属于易燃物和可燃物,引发火灾或者导致火势蔓延的问题日益受到人们的关注。涉及人民生命财产安全的问题不容忽视,因此世界各国也对纺织产品做出了一系列关于纺织品阻燃要求的相关条例法规。本文对缝编非织造布性
采用SBM-Undesirable模型测算了1999—2017年中部六省的碳排放效率,分别计算了产业结构合理化指数和高级化指数,利用耦合协调模型考察了碳排放效率与产业结构优化的耦合协调度,并对其影响因素进行了实证分析。结果表明:中部六省碳排放效率和产业结构合理化的耦合协调度较低,处在中度失调和中度协调之间,碳排放效率和产业结构高级化的耦合协调度处在中度失调和中度协调之间,但有明显上升的趋势。人力资
本文主要研究偏序集的连通性.有两大方面,一是在有限偏序集上,给出连通的定义及性质.另外是在偏序集上定义连通的概念,并给出连通的一些性质.事实上,后者是前者的推广.首先引入并考察步集,利用步集作为工具建立(有限)偏序集元素间的连通关系.此外,在(有限)不交并偏序集上给出分支、可分分支、不可分分支等概念.指出真通集、非连通偏序集、不交并偏序集三者在结构上的联系.最后讨论有限偏序集与偏序集连通性的相容性
随着计算机算力突破性的提升,卷积神经网络(CNN)已经成熟应用在安全监控、语音语义识别、图片分类、目标识别、智能控制等领域。近年来,神经网络的训练和推理的主要使用平台是GPU,但GPU平台价格昂贵、功耗较高、不适合嵌入式等微型设备,而FPGA平台具有并行高速运算、功耗低、价格一般、适用于微型设备等特点。因此,基于FPGA的卷积神经网络加速平台应运而生。本文首先介绍了CNN卷积神经网的各层结构,包括
毫米级海藻酸钙载水胶囊(CaSA-Caps)具有制备条件温和,包埋率高,生物相容性好的优点,特别适用于对温度和化学品敏感的活性物质的包埋。但由于其pH及温度敏感性,剧烈或长时间的化学作用均会导致它一定程度的降解或塌陷,CaSA-Caps的表面改性方法受到了制约。因此开发反应条件温和、且反应迅速的表面改性方法,实现其保水性能的调控,是目前亟待解决的问题。本研究制备了粒径均一、球形度良好且容载量高的C