【摘 要】
:
由于目前常见的多标签数据如图像、基因、音乐、文本等都是数值型的数据,因此使用聚类的方法对它们进行多标签学习分类取得了较好的效果。但是,聚类的算法必须涉及到示例间距离
论文部分内容阅读
由于目前常见的多标签数据如图像、基因、音乐、文本等都是数值型的数据,因此使用聚类的方法对它们进行多标签学习分类取得了较好的效果。但是,聚类的算法必须涉及到示例间距离的计算,而多标签数据一般都是高维的海量数据,因此在聚类过程中的示例间距离的计算将是一个非常耗时的过程,特别是在计算欧几里德距离时,还要计算平方和后开平方根。通过研究多标签学习的算法发现,ML-KNN与ML-RBF是目前效果较好的基于聚类的两种多标签学习算法,无论在效率与分类效果上都比其他方法好。 为了提高多标签学习的性能,解决多标签学习数据集维数太高影响学习效果以及学习时间开销太大等问题,在进行多标签学习前,先对大规模高维数据进行降维是非常有必要的。本文提出一种基于随机投影的多标签降维算法(Multi-Label RandomDimension Algorithm based on Random Proiection,MLRDA-RP),将基于距离的多标签学习方法与随机投影结合起来,用随机投影的方法对多标签学习数据先进行降维的数据预处理,再将降维预处理后的多标签数据应用于基于距离的多标签学习,最后对降维后的数据进行学习与预测,从而对多标签学习进行优化。 最后,本文对两个基准数据集自然场景分类数据集和酵母基因功能类别数据集对MLRDA-RP算法进行实验,将经过随机投影预处理数据后进行的多标签学习和未经数据处理的多标签学习,分别从聚类效果、时间性能、分类效果以及整体性能几个方面进行分析比较。通过将本算法与ML-KNN和ML-RBF这两种基于聚类型的多标签学习进行分析对比。实验结果表明,多标签数据通过随机投影降维处理后进行的多标签学习,不仅在训练阶段的时间性能有明显提高,而且分类准确率基本保持不变,有些甚至当降维百分比达60%,不仅分类准确率基本保持不变,甚至比原数据集还要高。
其他文献
在美国加利福尼亚州和内达华州边界的沙漠里,有一个莫诺湖。据说有76万年的历史了。莫诺湖能在沙漠中几十万年都不枯竭,是因为有五条来自雪山的河流源源不断地把水注入湖里。莫诺湖湖水看起来清澈透明,谁都忍不住想喝一口,但这看似纯净的湖水,却是又苦又咸,为什么呢? 后来,经过科学家们的努力,终于解开了莫诺湖湖水为什么不能饮用的秘密。莫诺湖虽然有五条河流注入,却没有出口流出,河水在湖中不断积蓄,在阳光的照射
暑假生活ABC 企盼已久的暑假终于到来了,小A、小B和小C兴高采烈地走出校门。 小A说:终于自由了,我的时间我做主,想玩啥就玩啥,魔兽打到70级、睡觉睡到自然醒、篮球打到太阳西……哈哈!老班拜拜喽!难对付的就是我妈,不过我有杀手锏,只要说离家出走,她就没招啦。当下之急先逛超市,买些游戏盘还有零食,我要可口又可乐。 小B说:我的暑假安排比较满,父母早就给我报了辅导班。有班上也好,省得在家总
广东省中小学第二届“暑假读一本好书”活动 暑假是一个漫长的节日。在这段阳光灿烂的日子里,我们的目光在树荫下发现蜻蜓的舞蹈,见识过蚂蚁征战,以及头顶的天空,如海洋一般湛蓝……哦,这是多么适合读书的美妙时光。 欢迎大家踊跃参加由广东省教育厅主办,广东教育杂志社承办的广东省中小学第二届“暑假读一本好书”活动,在书香中度过快乐假期。 一、活动内容 各市县教育局和中小学校根据活动组委会推
孔繁森殉职的噩耗传出后,人们无不为之震惊和痛惜。在阿里,在拉萨,在聊城,在他工作和生活过的地方,成千上万的人在呼唤着孔繁森的名字,人们在他的遗像前泣不成声,泪如雨下,
随着中国改革开放和市场化经济体制改革的不断推进,农村劳动力出现了大规模的转移。目前农民工就业信息服务发展相对滞后,远不能满足就业市场上不断增加的就业要求。阻碍农民工
“小树要剪,小孩要管,玉不琢不成器。”(刘绍棠《玉不琢不成器》) “是童年太多太多的忧伤,积蓄了我奋发的力量,启动我智慧的大门;是童年的苦楚磨练了我坚忍不拔的意志和吃苦耐劳的精神。我感激这早来的忧愁,这无情的痛楚,是它啃掉我童年的时光,又是它给我勤奋的智慧的童年,给我美好的未来。”(洪三泰《忧满少年心》) 捧读眼前精选的《我的少年时代》书稿,我时时被文中亲切、睿智、精彩的语句打动。书中每一位作
真正的智慧是有穿透力的,能破一切假象,直奔目的地。——中国列车电视·广源传媒CEO李平
True wisdom is penetrating, can break all illusions, went straight to the des
中小型电子产品制造企业是珠三角制造业的重要组成部分,如何提高生产管理水平应对产业升级的需要,事关《珠江三角洲地区改革发展规划纲要(2008-2020年)》的落实。论文以华南农
主持张文迪(江西教育学院中文系) 在古今中外的文坛上,善于模仿的人很多,仿作不胜枚举。一种新的文学样式出现了,总会有人竞相模仿而创作新篇。十七世纪印象派大批评家金圣叹,曾写下他觉得最快乐的33件事,文章题为《不亦快哉》。此后,诸多文人墨客,纷纷仿写出各种不同“版本”的《不亦快哉》。今天我们选几篇来开开眼界,说不定,我们也能“仿制”出精彩的文章来——不亦快哉? 金圣叹批《西厢》,拷红一折,有