摘要
本发明提出了一种在6G网络框架下的双时间尺度MuAR系统资源分配方法,基于双时间尺度资源分配框架,以联合优化长期计算资源分配和短期信道与子帧配置,在确保端到端延迟低于16毫秒的同时,最大限度地降低虚拟对象呈现在不同显示设备中的位置偏移率。为了克服传统MA‑DRL方法的限制,本发明采用完全非集中式的学习策略,即每个智能体自主训练本地化模型,从而能够快速适应瞬时的环境变化,同时保持决策响应能力,将图注意力网络集成到完全非集中式的学习框架中,明确模拟智能体之间隐藏的双向干扰依赖关系,以促进协调优化;开发了贝叶斯优化增强型深度确定性策略梯度算法,利用计算需求与计算资源分配决策的联合先验分布来指导探索,以提高DDPG的学习效率。
技术关键词
系统资源分配方法
深度确定性策略梯度
函数逼近器
解析器
累积分布函数
决策
深度Q网络
注意力
虚拟对象
梯度下降法
现实系统
节点
生成信道
资源分配框架
网络深度
主机
多用户
系统为您推荐了相关专利信息
数字孪生体
粒子群优化算法
智能控制方法
数据驱动模型
带钢
自动化软件测试方法
测试场景
自然语言
代码覆盖率
页面展示测试
智能电容器组
优化控制方法
平衡控制策略
深度强化学习
剩余使用寿命
预测误差
样本
变量
遗传算法优化
拉丁超立方采样