计算机围棋中的搜索算法研究

被引量 : 6次 | 上传用户:wcj_lp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
围棋长久以来被认为是人工智能领域的一大挑战,并且为人工智能研究提供一个很好的实验平台。相对于国际象棋的搜索树只有几十个分支系数,围棋在每一步棋的选择上多达几百个,这使得解决围棋问题极其复杂。在MCTS (蒙特卡洛树搜索算法)出现以前,计算机无法战胜业余选手。目前计算机围棋在9×9的小棋盘上已经达到了专业水平,但在19×19的大棋盘上棋力一直很低。虽然很多研究人员对计算机围棋算法的改进都做出了不少尝试,但仍然无法从根本上解决计算机围棋从小棋盘到大棋盘的棋力大幅下降的问题。一种可能的改进是用多个并行的局部UCT(信心上限树搜索算法)搜索来替代全局UCT搜索,以期用同样的计算资源来达到更深的有效搜索深度。本文力图沿着这一研究思路,做一些初步的尝试。本文从围棋死活问题着手探索局部搜索算法的适用性,以及围棋局部求解的复杂度问题。本文的主要内容如下:1)讨论了计算机围棋领域的历史、研究现状和研究困难。阐述了计算机围棋领域中涉及到的模型、理论及经典搜索算法,分析了各搜索算法的一些特点。论证了改进UCT算法在计算机围棋领域的优越性。2)提出了封闭域UCT算法的概念,然后通过改写Fuego的全局UCT搜索算法,实现了封闭域UCT搜索算法,并在64个封闭域围棋死活问题上进行了测试,将封闭域UCT算法与GoTools(一种经典的围棋死活求解程序)以及职业棋手解死活题的正确率和速率比较。在较快模式的围棋死活解题过程中,速度和正确率要比GoTools和职业棋手要好。3)提出了最小迭代次数的概念用以分析搜索时间规模与初始空白点数之间的关系。初步结果表明,封闭域UCT算法能够在不使用任何领域知识的情况下,把给定围棋死活问题的初始分支系数从5-16降低到2.3以下。从正确率和速度两项指标来看,证明封闭域UCT算法在围棋死活问题上具有有效性,另外也反映了多个并行的局部UCT搜索来解决围棋全局搜索问题的研究思路具备可行性。
其他文献
在司法实践中,司法人员的办案过错追究机制存在缺陷,表现在错案标准的行政定量化,一定程度上忽视司法运行规律。不论哪个部门负责羁押必要性审查,都不可回避“错案”追究的问
“同时”是一个特殊的时间词语,兼具时间名词、时间副词及连词的一些特征。本文以CCL语料库的语料为语言事实,从动态的虚化,静态的语义、句法、语用、篇章等角度出发,对“同
羟基磷灰石陶瓷充填颌骨空腔性缺损15例的远期疗效观察四川省人民医院(610072)林淑华,詹斌,杨小民,张梅本文报道15例颌骨囊肿患者经手术刮治后用颗粒型羟基磷灰石陶瓷(HAC)充填骨腔缺损的远期疗效
<正>医疗机构管理者、一线临床医务工作者需在实际工作中加强医疗技术危害学习,提高医疗风险意识,不断探索降低医疗风险的策略和方法。随着医疗技术的不断进步,新医疗技术在
2007年的次贷危机在一定程度上说也是一次银行危机,造成的不良影响仍未消除。银行体系的不稳健会带来银行倒闭、经济衰退等,甚至会出现政局动荡。这场席卷全球的金融危机凸显了
为了生态加固及防护土质边坡,提高边坡抵抗较深层滑动的能力,研发了根系-拉索-石笼网共同作用的生态护坡系统。工作机理为:浅层滑坡体推动柔性石笼网挡墙前倾,乔灌木根系的抗
随着大规模的水利建设和水土保持工作的实施,流域下垫面条件发生了明显的改变,其暴雨产生的洪水也相应发生了变化。如何评估水利水保措施对洪水的影响及其程度是一个重要的研
无固定期限劳动合同是指用人单位与劳动者在签订劳动合同时,双方约定无确定终止时间的劳动合同。劳动关系的存续期限不确定,具有较强稳定性,在特定条件下具有强制缔约效力,是
改革开放以来,我国经济迅速发展,“适者生存”已成共识。企业作为市场最主要的主体,彼此之间竞争加剧,再加上全球经济一体化程度的加深,使得国内企业面临的竞争更加激烈,企业整体价
本文主要是通过使用发动机模拟仿真技术,对其性能进行优化,同时辅助试验进行验证和对比最后得出相应的结论。本文主要内容如下:发动机进气系统优化。发动机进气系统优化的主要