【摘 要】
                                :
                                传统的机器学习的研究中往往倾向于将有标签的数据和无标签的数据分开研究,但是在现实生活中,这两种情况往往是并存的。半监督学习便由此应运而生,在传统应用中往往将半监督
                              
  
                             
                           
                                                       
						    
                            
                        
                        
                            
                                论文部分内容阅读
                            
                            
                                传统的机器学习的研究中往往倾向于将有标签的数据和无标签的数据分开研究,但是在现实生活中,这两种情况往往是并存的。半监督学习便由此应运而生,在传统应用中往往将半监督作为一个聚类的改进方法,却没有将聚类的优势应用于半监督学习中,因此本文就此进行了深入探究。半监督学习主要目的是在仅有少量标注数据集和大量未标注数据集的基础上获得一个良好的学习器。自训练算法便是半监督学习的重要算法,然而自训练过程中有两个问题需要解决:首先是如何从无标签数据集中选择合适的样本标记后加入到有标签样本中。其次,在无标签样本标记过程中会出现错标现象。针对自训练的两个问题,在做了有效的研究后,我们提出了一个算法以解决两个问题。大体思想如下,在用分类器标记后,用聚类对新标记的无标签样本数据集进行处理,然后从聚类中选取有效的新数据更新训练集,然后采用数据编辑技术剔除错标的样本,这样就能避免分类器受到错标样本影响。为了衡量该算法的效果,我们在标准数据集上对算法进行了测试,通过与其他算法的对比,结果表明在引入聚类时,算法要比对比算法的效果好,而且算法的收敛速度要比对比算法快的多。
                            
                        
                        
                        
                            其他文献
        
 
                            
                                
                                
                                    随着航天科学技术的不断发展,航天器星载设备系统中的设备数量、种类都急剧增加,对航天器星载设备系统网络的自适应性、数据转发效率和容错性的要求也随之提升。SpaceWire总                                
                                
                             
							 
                            
                                
                                
                                    随着社会信息化的不断推进,如何对海量的信息进行有效地组织和管理并进行快速地查找,是全文检索技术面临的一大挑战。全文检索技术给海量文本信息的管理和查找带来了方便,但是也                                
                                
                             
							 
                            
                                
                                
                                    当今,晶体管电路已经逐渐接近其物理上的性能极限,摩尔定律在2005年左右开始失效了,人类再也不能期待单个CPU的速度每隔18个月就翻一倍,单机的数据清理能力再也满足不了当今人们                                
                                
                             
							 
                            
                                
                                
                                    虽然水下图像采集是获取水下信息的重要途径之一,但在水下环境中,图像质量严重退化,包括颜色失真、细节模糊及对比度下降等。水下图像退化主要是由光在水体中的衰减和散射造                                
                                
                             
							 
                            
                                
                                
                                    模式识别技术目前已发展成为一门强大并且有旺盛生命力的学科,该技术目前已被广泛应用于工业、军事、农业、生物医学等各领域,自动完成对不同对象的智能识别,且识别误差率较                                
                                
                             
							 
                            
                                
                                
                                    随着无线网络的不断发展以及无线流媒体应用的风靡,各种无线流媒体系统应运而生,在该背景下,实验室自行开发了适用于无线环境下的流媒体系统CWMS(Clear Wireless Multimedia                                
                                
                             
							 
                            
                                
                                
                                    制造网格平台集成了众多制造企业的资源,并实现资源的全面共享。在制造网格环境中,节点间的交互行为主要分为请求资源和提供资源共享两种。如果能通过节点问交互行为的成败来                                
                                
                             
							 
                            
                                
                                
                                    无线传感器网络的资源受限,因此如何在无线传感器网络中实现低能耗的可靠传输显得尤为重要。协作通信是一种虚拟的MIMO技术,结合了分集技术和中继通信的思想,可以提高通信的                                
                                
                             
							 
                            
                                
                                
                                    网络带宽的增加使得互联网上的多媒体应用成为可能,并得到了广大用户的喜爱。但是由于多媒体文件,尤其是视频文件太大,多媒体数据在传输时,文件服务器带宽成为整个系统的瓶颈                                
                                
                             
							 
                            
                                
                                
                                    信号在水声信道中的传递受多径干扰的影响十分重大。对水声信道影响较大的几个因素是:水声信道参数、传播损失和多普勒频移。尤其在水深较浅的区域,直达声和反射声混合形成复