1 / 15
文档名称:

基于Stackelberg...深度强化学习的计算卸载策略 周娴玮.pdf

格式:pdf   大小:1,603KB   页数:15页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于Stackelberg...深度强化学习的计算卸载策略 周娴玮.pdf

上传人:彩霞 2022/3/16 文件大小:1.57 MB

下载得到文件列表

基于Stackelberg...深度强化学习的计算卸载策略 周娴玮.pdf

文档介绍

文档介绍:: .
系统仿真学报和不完全信息博弈下的策略。完全信息博弈下,证明该博弈存在唯一纳什均衡解;不完全
信息博弈下,将环境建模为部分可观测的马尔可夫决策过程(Partially Observable Markov Decision
Process, POMDP),并提出一种基于二阶段深度强化学习(Two-Stage deep reinforcement learning,
TSDRL)的最优卸载策略。仿真实验表明,该算法相较于 D-DRL 算法能减少 %的时延及
%的能耗,有效提高用户 QoE(Quality of Experience)。
关键词:5G 混合专网;计算卸载;Stackelberg 博弈;Nash 均衡;POMDP
中图分类号: 文献标志码:A
DOI: .-1118
Computation offloading strategy based on Stackelberg game and DRL
Zhou Xianwei, Gong Qixu, Yu Songsen
(School of Software, South China Normal University, Foshan Guangdong 528225, China)
Abstract: In order to achieve optimal computation offloading strategy for different types of MEC users in
5G hybrid private network, Stackelberg game is utilized to model for two kinds of users competing for
MEC server resources. Subsequently the strategies of complete information game and partially incomplete
information game are discussed respectively. It is proved that there is a unique Nash equilibrium solution
in the complete information scenario. Whereas in the incomplete information scenario, the environment is
model as POMDP, and a two-stage deep reinforcement learning(TSDRL) is proposed to obtain optimal
computation offloading strategy. Simulation results show the effectiveness of the proposed algorithm with
a total reduction of % time delay and % energy consumption compared with the D-DRL
algorithm, and thus better user QoE(Quality of Experience) is achieved effectively.

最近更新

膝关节骨性关节炎中医外治法综合康复方案的临.. 2页

膀胱粘膜片状移植浆肌肠段重建输尿管的实验研.. 2页

硒砂瓜项目融资计划书 8页

2024年安替比林合作协议书 61页

2024年X射线影像增强器项目合作计划书 45页

舞蹈系大学生职业道路规划与管理 8页

五金机电设备商业计划书 7页

脊柱微创手术导航机器人运动控制系统的设计与.. 2页

脉冲埋弧焊接头力学性能研究及工程应用的开题.. 2页

脂肪来源干细胞参与大鼠软组织创面修复的实验.. 2页

胶原蛋白基薄膜材料的制备及研究的开题报告 2页

2024年HF-FB防弹玻璃项目建议书 63页

胃肠道间质瘤与平滑肌肉瘤均为Cajal细胞相关性.. 2页

肿瘤抑素和激光辅助5-FU缓释植入剂抑制肿瘤细.. 2页

肺静脉分型、标准型口部测量与相关变异的多层.. 2页

肠道病毒71型VP1基因抗原的表达及免疫活性的初.. 2页

肝癌组织FHIT和Survivin的表达及其相关性的探.. 2页

聚类与分类算法及其在铝电解数据分析中的应用.. 2页

聚合物铁电超薄薄膜制备及其电学热学性质研究.. 2页

聚乳酸共混材料的形态与性能的开题报告 2页

职业适应期大学生员工情绪智力及其与工作绩效.. 2页

耐辐射异常球菌冷激蛋白的功能鉴定及转录组分.. 2页

考虑挤土效应的管桩复合地基数值模拟方法研究.. 2页

美籍教师与中国学生之间的文化冲突及解决方法.. 2页

美国海洋领土战略对我国海洋领土安全的影响的.. 2页

罚金刑数额研究的开题报告 2页

网络环境下的非英语专业大学生语言学习策略:.. 2页

网络控制系统时延特性分析及控制器设计的开题.. 2页

网络交易中消费者权益保护法律问题研究的开题.. 2页

缺血性卒中恢复期中医证候与可干预性危险因素.. 2页