一种基于直觉模糊熵的特征选择研究

来源 :云南大学 | 被引量 : 1次 | 上传用户:sunna2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,“维数灾难”成为困扰研究者的问题。面对:“维度灾难”,为了能够高效准确对数据进行分析挖掘,目前研究者采用特征选择方法对数据进行降维处理。随着研究深入,出现了很多特征选择算法,但各种方法都有其一定程度上的局限性和缺陷。为了能够高效准确地获得最优特征子集,使得数据分析挖掘获得更高性能,本文提出一种基于直觉模糊熵的特征选择算法。首先论文提出的特征选择算法,利用直觉模糊C均值聚类算法求得每个特征数据对类标的直觉隶属度,其次通过求得的直觉隶属度计算出特征所对应的直觉模糊熵,最后将熵值的大小作为特征选择的评价测度,特征直觉模糊熵越小,特征的识别区分度越大,对数据分类贡献越大,以此完成对原数据的特征选择。通过实验对20-newsgroups高维数据集进行特征选择,获得最优特征子集,然后用最优特征子集构造KNN及SVM分类器,再用分类器对20-newsgroups数据集进行分类,将分类的结果用分类器评价指标准确率,及精确率和召回率的调和平均值F1分数进行性能评价。通过实验验证了提出算法对高维特征的数据进行特征选择时,具有较好的表现,且优于一般的特征选择算法。总的来说,该论文研究提出的基于直觉模糊熵的特征选择算法解决了分类器处理高维数据集低效的问题,论文贡献点如下:1、通过直觉模糊集与信息熵理论相结合,利用隶属函数和非隶属函数共同表征直觉模糊集的不确定性对直觉模糊熵的影响,故将这种特征对类标的模糊性的描述作为特征选择的评价测度;2、对于直觉隶属函数的构造,目前还没统一的数学模型,该论文提出一种利用直觉模糊C均值聚类算法对隶属函数的生成方法。
其他文献
十八大指出要以“处理好农业、农村、农民问题作为全党工作重中之重”为重要战略思想,并提出我国新阶段的“强农、惠农、富农”政策,从政策及战略思想可以看出农业发展已处于我国发展战略的第一位置。然而频繁发生的自然灾害和市场波动对农业造成了巨大的影响,严重影响农产品的产出和市场价格,对农户利益产生了巨大的影响。因此研究如何规避这两大因素对于农产品的影响,对提高农户收益,优化农产品供应链具有重大意义。通过中央
2012年9月17日,国家心血管病中心、中国医学科学院阜外心血管病医院在京发布消息说,国家心血管病中心阜外医院近日成功为两例严重主动脉瓣狭窄的患者通过“不开胸”的方式置入
完善数字化校园建设在未来高校建设中随着互联网技术推动变得愈加重要。怎样通过互联网、移动通信等技术来进一步完善数字化校园建设,服务于校园师生生活和教学成为了未来高
本研究采用SCL-90问卷,对183名大学新生进行调查.心理问题检出率为27.9%,主要在敏感化、偏执、强迫症及抑郁四个因子上存在较为严重的心理问题.
目的构建幽门螺杆菌(H.pylori,Hp)尿素通道蛋白基因UreI的融合表达载体,并在E.coliBL21中表达,为进一步研究UreI的功能奠定基础。方法利用分子克隆技术以Hp DNA染色体为模板,扩
吉登斯的结构二重性学说是在对经典社会理论中的基本问题,即个体与社会、人与结构、主体和客体之关系所持的二元论的正统共识进行批判性解构的基础上提出来的.结构化理论旨在
区域产业转移和结构优化,可以理解为一个区域内部和外部国民经济不断发展和强化的过程.从这个角度来看,区域产业转移和结构优化推进路径是这样的:首先是商品输出,是指对邻近