文档介绍:西南大学
博士学位论文
计算机围棋中的算法研究
姓名:岳鹏
申请学位级别:博士
专业:基础心理学
指导教师:邱玉辉
20070401
计算机围棋中的算法研究摘要基础心理学专业博士研究生岳鹏指导教师邱玉辉教授研究的发展。作为博弈研究的主要内容之一,棋类博弈得到了满意的解决,唯一的例外的是围棋,目前最优秀的围棋程序的水平还不及人类初级棋手。由于围棋的搜索空间太大、计算机难于处理模糊概念且难于设计学习算法,造成了计算机围棋程序的棋力是人工智能领域的一大难题。同时,开发出与人类棋手水平相当的围棋程序也有助于对人类认知能力的理解。所以计算机围棋研究具有重要的理我们首先介绍了国内外计算机围棋研究现状,包括基础算法、搜索算法和学习算法三方面并介绍了部分计算机围棋程序,认为计算机围棋的搜索算法主要有量机、贝叶斯模式分类、基于解释的泛化和并行算法等等,指出了目前研究中存然后,我们简述了本研究的相关理论基础,包括数学形态学、有限状态机、接着,我们阐明了本研究提出的棋手思维模型、基础算法、搜索算法、学习概念、提出了局面的层次表示法、归纳并分类了大量围棋术语、提取了目标概念、博弈是人工智能的重要研究主题,,如何提高论意义和实用价值。算法、惴ā惴ā惴ā惴ê蚼算法等等,涉及到的学习算法和理论基础主要有组合博弈理论、数学形态学、蒙特卡罗算法、模糊学习、分治法、强化学习算法、遗传算法、神经网络、支持向在的主要不足主要表现为局面表示法欠完善、中盘策略欠完整以及学习算法欠成熟。线性模型、感知机与遗传算法。算法及相应实验结果。具体说来,我们完成的主要工作与创新点包括以下几个方面:一、提出了一个完整的棋手思维模型。这是在提出了领土领海和领空等地域建立了目标图、总结了若干目标选择原则和走步属性并分析了棋风概念的基础上完成的。这个模型的特点在于它的完整性和围棋术语的分类、目标选择原则与走
三、设计了J奖嗦敕椒āK谀J降牧诮卣鳌⑿辛刑卣骱吐掷特征进行编码,其突出优点是与模式的黑白对称性、旋转与翻转对称性以及平移关系构成的单一目标的二维向量。复合目标搜索算法的优点是其调用的基本函数学习算法上,能象人类棋手一样地不断地学习,计算机围棋才有希望。、设计了基于数学形态学的局面层次表示法、棋群聚类算法和地域划分算法。这些有统一理论基础的算法计算简单,实验结果表明其效果良好。利用已有的数学形态学理论可以设计更多有意义的启发式策略。对称性均无关,实验结果表明这种模式编码方法性能良好。在基础算法方面,我们还设计了一种走步增量算法。四、设计了复合目标搜索算法。我们认为复合目标可看作是由“与”或“或”可由单一目标搜索算法的基本函数合成。我们还比较了经典搜索算法的性能。五、设计了J娇庥攵ㄊ娇庋八惴āJ笛榻峁砻髁似溆行裕终学习到的模式库与定式库占用的空间比较小。另外,还设计了ㄊ库学习算法,实验结果也表明了其有效性。在学习算法方面,我们还设计了棋形与气术语的示教学习算法和棋风模型的遗传学习算法。六、开发了以此棋手思维模型为核心的计算机围棋程序迪至松述各算法。衔F迨钟涤心J娇夂投ㄊ娇猓懈髯缘钠宸纾黄迨衷谕瓿棋群聚类和地域划分后,在目标选择原则的指引下以对方最后所下之子为焦点进行目标猜测,同样在目标选择原则及棋风的指引下生成特定目标,继而以目标为导向在各自的模式库和定式库推荐走步的作用下进行搜索发现走步,再根据走步属性选取特定走步,如果目标不成功或无可行走步。则重新进行地域划分或根据其它决策原则生成其它目标,直到发现合适走步:在这一过程中,模式库和定式库影响了走步的推荐。棋风影响了目标之间的跳转。最后,我们探讨了棋手思维模型的评价,走步增量算法与走步扫描算法的关系、数学形态学方法在基础算法中的应用、劫与共活现象对搜索的影响、搜索树特点与心理因素的关系、搜索时间估计、局面评价函数、目标搜索的可学习性以及棋风建模等问题,并探讨了机器学习方法在计算机围棋中的应用可能性,提出了进一步的研究计划。计算机围棋研究作为人工智能领域的一个分支,与心理学有着天然联系。我们在研究过程中,特别强调以人类棋手为本的原则,力求棋手思维模型与人类棋手真实思维过程的高度契合,力求其学习算法的完善。我们今后的研究重点将在关键词计算机围棋,棋手思维模型,搜索算法,学习算法西南大中博畚
琤,...瓹,.畉辩。.甃琣,’,、;.簅.,,.
.,.琣琣/.,。甈‘,琫,
,痡/.。瑃琫,,甇,山.,,,.籥,甀痶琣甇篊瑂
图目录图甀棋盘与棋子⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图诺恪图劫⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯