文档名称：

多AGENT协作团队的学习方法的研究（可复制毕业论文）.pdf

格式：pdf 页数：136页

下载后只包含 1 个 PDF 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

多AGENT协作团队的学习方法的研究（可复制毕业论文）.pdf

上传人:mkt365 2013/12/24 文件大小：0 KB

下载得到文件列表

多AGENT协作团队的学习方法的研究（可复制毕业论文）.pdf

相关文档

文档介绍

文档介绍：:—驯ば├急罾堇菪哇依夹├妓勘钭埂!!!R摘要示形式可以合并许多相似的状态和行为,从而使得状态行为空间得到了缩减:—:利用强化学习的理论以及经验共享和马尔可夫博弈理论的思想,对多炕胺椒ń岢隽艘桓鍪屎嫌诙郺协作团队的协作求解框架,并在此基础上实现了一个原型系统。在挤作求解框架中,结合团队工作模型的理论和理性P偷奶氐悖出了从发起组建团队到结果评价的整个协作求解的过程:在原型系统的淌迪,提出了⋯个结构以及相应的多线程并发控制机制和会话管理方法。其中,多线程并发控制机制使得芄挥行У赝瓿删霾吆托魅挝瘢夯峄肮芾矸椒ò过程,以及对于不同的状态转换过程制定相应的消息处理流程,该方法使得镜会话过程能够得到有效的实现。已经通过了多项应用实例的测试和评估,结果表明结构是可行的。基于结构的芄怀中灾鞯卦诵校并且能够有效地完成各种推理、协作等智能行为。炕胺椒ㄒ攵郺协作团队的学习过程,提出了一种共享经验元组的多炕胺椒⊿狹。其中,提出了一种基于偶图的多魍哦拥慕对的知识表示形式,其中的状态和行为是采用类似于欧氏距离的数值形式,采用该知识表所共享。作者通过一系列实验对该算法进行了验证,结果表明采用该学习算法之后,团队肓型哦咏峁购屯哦釉俗鞴痰娜范ㄎ侍獍渌Ф椒ń剿鳌F鋞礼钊埘多际踝魑R恢址植际饺斯ぶ悄苄录际跻丫杆偕傅叫畔⑸缁岬母鞲龌方谥校究中的一项颇受关注的前沿课题。行了研究:对改进团队协作性能的其他学习方法也进行了探索。作者完成的主要工作和取得的创新性成果如下:制定协作协议、协商协议和招聘协议等三种交互协议,采用有限状态自动机细化状态转换色分配算法,该算法通过应用实例验证是明显有效的;提出了~种刺担形V有序算法依据子任务的同构性,采用相似性转换,使得每个木樵W榭梢晕F渌黙协作的效率得到了明显提高。岢隽艘恢只谕哦勇矶纱蟛┺牡亩郺协同强化学习方法狹!F中,提出了一种基于长期得益矩阵的阶段博弈的评估方法,长期得益矩阱可以随荔与环境的不断交互和获得环境给予的回报而逐渐收敛至稳定值;提出了一种基于虚拟行动过程的行为选择策略,它可以驱使扇∽钣诺男形!,其结果都是收敛的,表明竣算浊是有效的,实验还列影响稳定值大小平收敛速』篁鸲咏峁沟娜范ㄎ侍猓岢觥痡恢质屎嫌诙郺协作的基于案例的学习方法,其鐷了兀组表示的案例结构和案例的相似性计算方法,通过基于案例的学习可以提高闭队形成的效率:针对团队运作过程的确定问题,提出了一干叶谔致矍墓彩堆с莘椒ǎ谝蛩氐贸隽擞幸娴慕崧邸第
照该算法可以计算得出每个讨论主题的各个信念的信任度并对之进行排序,从而使得信任关键词:多低扯郺学习协作马尔可夫博弈度最高的信念被所有邮芪9餐拍睿梅椒ㄓ欣谕骋还餐拍睿銮客哦釉俗过程的连贯性。员呔晨涨谌挝裰械奶讲庥敫扇诺亩钥刮>掠τ帽尘埃哉庖皇道τ昧吮疚乃提出的多炕胺椒ǎ行У亟饩隽苏庖欢钥怪械男髡轿侍狻8糜用实例还可以推广到其他活动目标跟踪问题中,能够提高在动态环境中的协作问题求解效本文的研究,深化了多魍哦又械墓赜谛餮暗姆椒ㄓ胗τ玫难芯浚杂提高多魍哦邮视Χ肪车哪芰Γ贫郺学习技术的研究与发展,都具有协作团队强化学习率。一定的理论和实践意义。国防科学技术大学研究生院学位论文第页
產;,.,狿·瑀.—觕狹,—甿瑆痑,;..籺猘瓵..,。產‘.瓵,甌瑆瑂,,..—....—,瓸獀—猘,第『【
:猘,猘,琈猘,.甌產..,.,甇—.—甇.,琣第页琣
垒垒盐焦旦丛塑堂翌左鎏盟壅——作者指导教师签名:堕至吼抛牛生ㄈ星达型学位论文版权使用授权书王长媸独创性声明期:蹦露垒>鹿檀缘奶盟渥笸萦的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含学位论文作者签名:本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允许论文被查阅和借阅:可以将学位论文的全部或部分内容编入有关数据本人声明所呈交的学位论文是我本人在导师指导下进行的研究作及取得其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教育机构的学位或证书而使用过的柯料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文学位论文题目:功。乒丘乒月加日C苎宦畚脑诮饷芎笫视帽臼谌ㄊ椤日期:
一一————————————百佟!!!!!!!!!!!!R插图索引图猎人捕物问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图强化学习的基本模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯矶煞蚓霾吖獭⋯⋯⋯⋯⋯⋯⋯⋯。惴ü钩墒疽饽俊图计划图的示例⋯⋯