论文部分内容阅读
机器学习在人工智能的研究中具有重要地位,一个不具有学习能力的智能系统很难称得上是一个真正的智能系统。传统的学习方法是基于理想环境下进行研究的,即数据是完整的,所含噪声极少,甚至没有。但在现实世界中环境是非确定性的,即数据中普遍含有噪声,存在大量的不完整数据。因此,如何让系统更好地在复杂的非确定性现实环境下进行学习,成为机器学习领域里的一个重要课题。
Agent是当今研究的热点,是分布式人工智能的主要研究内容。本文以机器人足球Robocup为试验平台,Robocup的运行环境充满噪声,完全动态。研究各球员agent在非确定性环境下的学习机制,目标是使agent的学习能力更强,适应性更好。本文研究了一种神经网络学习机制,提出了一种改进的归纳学习算法IC4.5,并用以上两种方法实现了Robocup的截球技术和传球判断技术。本文主要的研究工作及成果体现在以下几点:
1.分析了机器学习中的噪声问题,对BP神经网络的学习机制、决策树学习方法以及可能近似正确PAC学习模型进行了研究和分析,并给出NN和决策树中的容噪和数据不完整性的学习问题。
2.设计并实现了一个用于测试机器学习算法的仿真机器人足球赛Robocup实验平台。
3.本文在研究和分析了机器学习中的数据不完整性问题的基础上,提出了一种改进的决策树算法IC4.5算法。实验表明,该算法能够充分利用训练样本的不完整性,有效处理包含多余数据的样本。
4.本文采用分层学习机制,利用BP神经网络完成了Robocup的截球学习;利用改进的IC4.5算法实现了Robocup的传球判断学习。经实验表明,其效果很好。