论文部分内容阅读
学习自动机隶属于加强学习的范畴,是人工智能领域中很重要的一类算法。数年以来大量的研究工作集中在提高学习自动机算法的精度和收敛速度上面。同时,由于学习自动机具有很强的抗噪能力,自适应的学习理论,完备的理论证明和在线学习与优化能力,学习自动机被应用在各个领域之中。因此,本文主要工作包括:
(l)调研现有的学习自动机算法,提出学习自动机的发展主线是不断提高学习自动机的精度与速度。指出现有的学习自动机算法的优点和缺点,强调了加快学习自动机算法收敛和工程实现的意义。
(2)分析学习自动机,主要包括固定结构学习自动机与可变结构学习自动机,并归纳与总结学习自动机算法的发展与设计方法。提出了更快的DiscretizedGeneralizedStochasticEstimatorLearningAutomata(DGSE)算法,并从理论上证明了该算法的收敛性。同时实验对比显示了该算法是现有学习自动机算法中最快的算法。
(3)阐述了学习自动机在各个领域中的应用,并且与学习问题的关系。进一步的提出了新的可以解决以往静态随机定位问题中的决策表的困境问题,同时也提出了解决动态随机定位问题的算法。最后从理论上证明了该算法,并且实验验证了该算法的有效性。
(4)从工程角度出发,将学习自动机的子函数优化,将时间复杂度从0(n2)将为0(n)。结合并行程序思想,使得C++实现的学习自动机程序的运行时间从Matlab程序的6天降低到了10分钟左右,也就是提高了700多倍的速度。从而极大的加速了新的学习自动机理论的设计和工程应用。