基于容噪和不完整数据环境的机器学习研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:zhaohuihuang8801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习在人工智能的研究中具有重要地位,一个不具有学习能力的智能系统很难称得上是一个真正的智能系统。传统的学习方法是基于理想环境下进行研究的,即数据是完整的,所含噪声极少,甚至没有。但在现实世界中环境是非确定性的,即数据中普遍含有噪声,存在大量的不完整数据。因此,如何让系统更好地在复杂的非确定性现实环境下进行学习,成为机器学习领域里的一个重要课题。 Agent是当今研究的热点,是分布式人工智能的主要研究内容。本文以机器人足球Robocup为试验平台,Robocup的运行环境充满噪声,完全动态。研究各球员agent在非确定性环境下的学习机制,目标是使agent的学习能力更强,适应性更好。本文研究了一种神经网络学习机制,提出了一种改进的归纳学习算法IC4.5,并用以上两种方法实现了Robocup的截球技术和传球判断技术。本文主要的研究工作及成果体现在以下几点: 1.分析了机器学习中的噪声问题,对BP神经网络的学习机制、决策树学习方法以及可能近似正确PAC学习模型进行了研究和分析,并给出NN和决策树中的容噪和数据不完整性的学习问题。 2.设计并实现了一个用于测试机器学习算法的仿真机器人足球赛Robocup实验平台。 3.本文在研究和分析了机器学习中的数据不完整性问题的基础上,提出了一种改进的决策树算法IC4.5算法。实验表明,该算法能够充分利用训练样本的不完整性,有效处理包含多余数据的样本。 4.本文采用分层学习机制,利用BP神经网络完成了Robocup的截球学习;利用改进的IC4.5算法实现了Robocup的传球判断学习。经实验表明,其效果很好。
其他文献
论文从数据仓库(Data Warehouse)的产生背景及其基本概念、联机分析处理(On_Line Analytical Processing-OLAP)的产生背景及其基本概念、SQL Server 2000体系结构、SQL Serve
数据集成是企业之间或者企业内各部门协同合作的需要.它的目标是实现各个异构数据源之间的数据共享,从而有效的利用资源,提高整个应用系统的性能.目前随着计算机技术特别是计
在计算机科学的许多领域,可满足性问题(SAT)都是一个重要的研究课题。SAT是一个NP完全问题,但在各种领域都需要快速算法来解决规模较大的问题,比如在人工智能中比较突出的规划问
学位
随着计算机系统规模和复杂度的不断增加,应用范围的不断扩大,人们对系统正确性的要求也日益提高。模型检验是一种形式验证技术,它的主要思想是构造系统的有限状态模型并穷尽搜索
随着计算机网络的发展,传统的计算机系统发生了巨大的变化,突出地表现为从集中计算(Centralized Computing)到分布式计算(DistributedComputing)的转变.分布式信息系统在人们
学位
随着信息化的不断发展,网络安全和信息安全的问题显得日益突出。表现在:因特网的共享性和开放性使网上信息安全存在先天不足,因为其赖以生存的TCP/IP协议,缺乏相应的安全机制,而且
入侵检测技术经过十几年的发展已经达到了一个很高的技术水平。当前的很多入侵检测系统都突破了传统系统所采用的简单模式匹配检测技术。Columbia大学开发的入侵检测系统[WEN
任何一个熟练的程序员都可以开发出一个能够使用的软件.但是构建一个可维护的、可伸缩的、健壮性好的企业系统就不那么容易.众所周知,现在的企业级软件系统变得越来越庞大,越