【摘 要】
:
海量音频数据检索技术的迅速发展,对已有的特征选择算法提出了严峻的挑战。迫切需要适应音乐数据集的准确性和运行效率等综合性能较好的特征选择算法以及机器学习方法。本文
论文部分内容阅读
海量音频数据检索技术的迅速发展,对已有的特征选择算法提出了严峻的挑战。迫切需要适应音乐数据集的准确性和运行效率等综合性能较好的特征选择算法以及机器学习方法。本文在高维音乐数据集的特征选择上开展了研究。主要工作包括以下方面:1.对比了各种经典特征选择算法的优缺点,对Wrapper和Filter两大类特征选择方法进行了实验分析。2.针对Wrapper算法无法给出特征权重的缺点,我们设计了CCRS算法,使用连续特征分类准确率来获得特征权重,对特征的贡献率给出了定量的描述,为特征分析和分类模型建立提供了重要的信息。3.为了改进ReliefF方法不能去除冗余特征的缺点,我们使用ReliefF+相关分析的方法和ReliefF+PCA/LDA的方法来进行改进实验。通过分析,我们提出了ReliefPCA方法,使用PCA的特征空间变换来进行去冗余的操作,同时保留了特征的可理解性。4.基于对Filter和Wrapper方法各自的优缺点,提出了Filter+Wrapper耦合的组合式特征选择算法ReliefGA。算法采用ReliefF指导遗传算法种群初始化,目的是提高遗传算法搜索近似最优解的速度,以便在较短时间内寻找到近似最优解。实验结果表明,从分类准确率,特征子集大小以及时间复杂度等多角度考察,该算法具有良好的综合性能。本文充分考虑了音乐数据集高相关性、高冗余度的特点,对特征选择算法进行了深入的研究,有针对性的做了很多有益的尝试,在保证特征可理解性,提高准确率等方面,取得了良好的效果。
其他文献
随着计算机软硬件技术的迅猛发展,互联网络、局域网络条件的大幅改善,以及IT经营意识的增强。许多企业甚至政府建立起了相对完善的IT运营体系,但是原有的IT架构无法较快地适应和
随着网络和通信设备的迅速发展,从PC到控制关键基础设施的系统都加入互联网,单个软件系统的错误可能影响多个系统,且便于攻击者利用软件漏洞进行攻击,攻击者无需占领物理的信息系
当前集群系统已经成为高性能计算体系结构发展的趋势,它极大地提高了高性能计算的发展,并逐渐从科学研究发展到其它各领域。在实际应用中,集群的软硬件资源相当丰富,这些资源
快速发展的3D应用技术给相关产业提供了难得的发展机遇,同时也提出了不少挑战性的问题。其中如三维重建一直是计算机图形学领域的一个研究热点,但鲜有研究试图重建物体的语义信
近年来,由于社交网络,即时通讯工具的普及,大量的文本数据涌入我们的生活。如何利用文本挖掘技术,从海量“堆积如山”的文本数据中更快速寻找到有价值的信息,成为各行各业的需求。
互联网和计算机网络正在为企业的全球化和集中化发挥着推动作用。尽管互联网和计算机网络在许多方面取得成功,但是在许多领域也存在着效率低下的问题。其中最严重,同时也是研究
由于软件规模的不断扩大和运行环境的逐渐复杂,软件安全漏洞问题正日益加剧,并不断威胁到政治、经济、国防和社会安全等重要领域。软件安全漏洞检测是对软件安全漏洞进行预防和
关于产品质量问题的研究由来已久,可靠性是产品质量的固有特性之一,是产品质量的重要方面。无论是硬件产品、软件产品还是软硬件结合的复杂系统产品,正确评估产品的可靠性是评估
搜索算法是逻辑证明中的经典方法,广泛用于直觉主义逻辑,古典逻辑等多种逻辑系统。Kripke模型是一个非常简单而有效的模型,它能对解释直觉主义逻辑的语义给予合理的解释。
如今,Web已经成为信息量最大、应用范围最广的传播媒体。但面对着Web中的海量数据,人们依然无法解决知识匮乏的问题。Web新闻的主题检测研究为人们提供了一种由数据管理向知识