文档介绍：.. ... ..

.. ... ..
烈象跆杪年轹仍p厶独创性声明学位论文版权使用授权书糍猫归≥本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研人已经发表或撰写过的研究成果,也不包含为获得重麽由&电太堂或其他教育献均已在论文中作了明确的说明并表示谢意。2重废由&电丕堂定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查重庆邮电太堂有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡学位论文作者签名:本学位论文作者完全了解有关保留、使用学位论文的规阅和借阅。本人授权可以将学位论文的全部或部分内容编入文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ导师签名:签字日期:月年作文期沦位字学签,¨1I-l-IIlj日:,
.. ... ..
摘要强化学习技术从控制理论、统计学、心理学等相关学科发展而来,被认为是,网络中研究认知用户频谱感知与接入算法,在实际情况中,由于硬件的限制及能量的消耗,尤其是伴随突发性业务的认知用户不可能完全感知所有信道的信息,因此我们需要解决部分感知问题;第二,频完美感知和不完美感知接入两种场景,详细地分类验证了其策略算法的性能;在POMDP关键词:认知无线电、强化学习、部分感知马尔可夫决策过程、机会式频谱接入、设计智能系统的核心技术之一。它对环境知识要求较少,对动态变化环境适应性强,应用于无线网络时兼容性较好,这些特点都使得强化学习与生俱来地成为认知无线电的备选技术,并且具有广泛的应用前景。本文将强化学习中一个典型的模型,部分感知马尔可夫决策过程ProcessPOMDP)AdHoc使其具有较强的学习能力,从而通过认知循环珻高效机会式地接入授权频谱。OSA谱感知接入策略应当同时具备机会识别和探索的能力;第三,如何在面临感知错误时,将对授权用户的干扰限制在一个指定的水平并最大化认知用户吞吐量;第四,频谱机会需要收发端联合识别,当有感知错误时,收发器能够同时跳频。POMDP状态量的基于信念向量的贪心策略算法,将感知与接入联合考虑,并将其应用于本论文的工作达到了预期的研究目标,这些算法能够最大化认知用户吞吐量及系统频谱利用率。多用户协作
.. ... ..
重庆邮电大学硕士论文
.. ... ..
hentechnologiesAndand.)whenspectnopportunityeffectively,meanwhileFouthly,thejointlytransceiver,、、·、Ⅳfollows.,mayall,,·exert111oneauserssense‘
.. ... ..
重庆邮电大学硕士论文KeyLearningPOMDPOSAMulti篊琑Cooperation
.. ... ..
目录POMDP21系统模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯POMDP23引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.3422934330AbstractIII2211222231232233333V
.. ... ..
35231不完美感知场景下的感知接入策略⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.382443834541149421524225842359不完美感知接入场景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯44263POMDP30POMDP30361