【摘 要】
:
随着现代社会数据膨胀,数据挖掘算法的应用越来越普遍,然而如何对该领域的应用程序进行质量保证具有极大的挑战。由于数据挖掘领域中许多应用程序无法验证其输出结果的正确性,或验证其正确性成本太高,传统的测试方法不再适用于该领域中应用程序的测试,这就是所谓的Oracle问题。然而迄今为止,对于数据挖掘领域的研究,大部分都集中在不断优化已有模型或者建立更精确的模型上,而在确保数据挖掘算法本身的正确性方面,所做
论文部分内容阅读
随着现代社会数据膨胀,数据挖掘算法的应用越来越普遍,然而如何对该领域的应用程序进行质量保证具有极大的挑战。由于数据挖掘领域中许多应用程序无法验证其输出结果的正确性,或验证其正确性成本太高,传统的测试方法不再适用于该领域中应用程序的测试,这就是所谓的Oracle问题。然而迄今为止,对于数据挖掘领域的研究,大部分都集中在不断优化已有模型或者建立更精确的模型上,而在确保数据挖掘算法本身的正确性方面,所做的工作非常少。蜕变测试是缓解Oracle问题的一种简单而有效的测试技术。对于蜕变测试来说,成功的测试用例仍然具有可用的信息,在它的基础上构造新的测试用例来对被测程序进行深入的检测:如果测试用例之间存在着特定的联系,那么其对应的输出也应该存在着某种特定的关系,这种关系就称为蜕变关系。本文对蜕变关系的研究主要分为两方面。1.研究数据挖掘算法中蜕变关系的构造及其检错效果。本文通过为数据挖掘算法构造一系列蜕变关系,进而对数据挖掘算法的实现及其返回结果的正确性进行测试与验证。通过一系列实证实验发现,本文提出的方法对数据挖掘算法的实现及其返回的结果均有较好的检错效果。2.挖掘蜕变关系的关键特征。软件项目的测试资源总是有限的,受限于软件项目的资源,实际应用中往往要求我们尽可能选取少量并高效的蜕变关系进行测试。本文从蜕变关系的组成部分出发,分别从蜕变关系的输入关系、输出关系以及蜕变关系的组合三大角度挖掘了蜕变关系的特征,并通过一系列实证实验结合交叉验证方法,得到了蜕变关系的一系列关键特征,用以指导人们构造或选择更有效的蜕变关系。
其他文献
ZSM-22沸石分子筛通常作为一种催化剂,在选择性催化裂解、烷烃异构化、甲醇转化制烃等过程中发挥重要作用。传统合成沸石分子筛的方法有机械化学法、水热合成法、晶种辅助法
吉尔·德勒兹在《运动-影像》中探讨了这样一种电影:这些电影的时间是从属于运动的,甚至可以说,时间是以适应故事为诉求被剪辑的。这种电影最突出的代表,就是好莱坞影片。这
氨苯砜(Dapsone,DS)不仅是目前治疗麻风病的首选药物,还可以治疗自身免疫性皮肤病、疟疾、风湿性关节炎、癫痫、肺孢子虫肺炎等多种疾病,具有广泛的适应症。但是,氨苯砜口服
心电图反映人体心脏活动的状态,不仅可以用于健康管理,还能够用于心血管疾病的预防和诊断。临床上通常采用的是基于标准湿电极的12导联大型心电图仪器,需要人体以平躺的姿势
气凝胶是一种超级隔热材料,在工业、航空航天等领域有着广泛应用,然而,SiO2气凝胶的最高使用温度为800 oC,纯ZrO2气凝胶的高温稳定性并不理想,与单元气凝胶相比,ZrO2-SiO2气
近年,一般自首的形式日趋多样化;实践对其认定存在较大分歧,甚至对相关司法解释有所突破,超出了惯性认知。因此,以1999-2019年间《刑事审判参考》中关于自首认定的58个指导案例为主要研究素材,针对一般自首实践如其本质、成立要件、投案认定等常见疑难问题,通过实证探究司法实践中的认定标准的历史演变脉络,以及当前具有“指示意义和约束性”司法观点,理清司法裁判立场的分歧、合理性以及自首认定标准的整体宽严
STEM由英文单词科学(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)首字母缩写组成。STEM教育已被许多发达国家作为国家行动的战略,承担着推动国家创新与提升国家竞争力的重大任务。当前,STEM教育在一些发达国家从高校到中小学具有国家的顶层设计、政策与经费的支持、连贯的课程设计和社会组织机构的广泛参与。如何在我国实现“本土化”的STE
市场经济的快速发展在提升人民生活水平的同时,对环境也造成了严重的污染。企业作为经济活动的主体,需履行相应的环境责任。现阶段,政府制定《新环保法》等法律法规,加大环境
形式概念分析是对数据进行有效的形式化管理与分析的一种数据处理工具,概念格作为其主要的数据结构,展现了形式概念之间的关系。粒计算自1997年被提出以来,利用粒度思维来对
移动机器人技术应用十分广泛,同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是移动机器人实现智能化的关键技术。常用的传统算法是基于贝叶斯滤波的SLAM,其在实际应用中存在估计精度不足的问题。在此背景下,本文以国家重点研发计划(SQ2018YFB16003105)为依托,研究基于卡尔曼滤波与粒子滤波的SLAM算法,并应用遗传算法、粒子群优化算