【摘 要】
:
对蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)算法在游戏“2048”中的运行机制进行了分析研究。在MCTS过程中,利用上限置信区间(Upper Confidence Bound Apply to Tree,U
【基金项目】
:
湖州师范学院校级科研项目(2018XJKJ63),浙江省湖州市科技计划攻关工业项目(2018GG29),浙江省软科学计划项目(2019C35006),湖州师范学院求真学院2019校级大学生创新创业科研训练项目(201902055)
论文部分内容阅读
对蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)算法在游戏“2048”中的运行机制进行了分析研究。在MCTS过程中,利用上限置信区间(Upper Confidence Bound Apply to Tree,UCT)算法计算当前局面所有可移动4个方向节点的UCT值,选择使得节点价值最大的方向作为下一次的移动方向,再经过扩展、模拟阶段,直到达到游戏限制范围后进行反向传播,以当前路径的局面评估值对其父节点、祖父节点直至根节点的节点价值进行更新,以此得到最佳移动方向,进而得到最优选择
其他文献
用原位自生法制备了20%TiC/Fe复合材料,并以W替代部分Ti制备了两种20%(TiW)C/Fe复合材料,研究了它们的显微组织与性能.结果表明:在20%TiC/Fe和20%(Ti0.8W0.2)C/Fe复合材料中,T
【正】群众对我们的信任,是我们办理民心网案件最大的动力。作为大洼县民心网工作站的承办人,我时刻以真诚的态度、高效的速度和提升人民群众的满意度来办理好每一件群众诉求
夏季利用遮阳网,可栽培小白菜、夏菠菜等;延长黄瓜、番茄、辣椒等春播菜生长期,增加产量,改善淡季蔬菜供应状况;进行花椰菜、芹菜、甘蓝、莴苣等覆盖育苗,可提高出苗率;覆盖栽培平菇
用放电等离子烧结(SPS)技术制备了Ti(C,N)基金属陶瓷材料.使用XRD、SEM对烧结体物相、微观组织进行了分析,并对金属陶瓷的硬度、抗弯强度和孔隙率进行了对比分析.结果表明:SP
对过度滥用的老抗生素所衍生的新药物的临床应用,促使抗生素耐药问题日趋严重。不控制抗生素的使用而限制抗生素的耐药性的想法是不现实的。健康组织、制药公司和研究机构已开
采用特殊树脂HRB-6作粘合剂,用专用设备对50B云母纸上胶,经一定温度烘焙压制得到H系列新型耐高温绝缘材料.经过实际使用证明,该产品工作温度达到700℃,工频介电强度大于20 kV
环状氨基酸是一种构型限制型氨基酸,因为它们的构象限制性特点有利于肽的生物活性构象的形成和稳定,在修饰多肽时引起的构象效应和生物学效应有着重要的理论和应用价值,常用