摘要
本发明公开了一种基于多目标深度强化学习的数字孪生体部署方法,针对数字孪生边缘网络进行分析,构建多目标深度强化学习模型的状态、动作和奖励函数,在状态中引入用户和智能反射表面的连接关系,在奖励函数中引入约束项的惩罚函数,然后对多目标深度强化学习模型进行设置和训练,实时获取当前数字孪生边缘网络的状态信息,采用训练好的多目标深度强化学习模型确定各个数字孪生体部署的目标边缘服务器。本发明设置多个优化目标,采用多目标深度强化学习来确定数字孪生体的部署策略,提高数字孪生边缘网络的合理性和工作性能。
技术关键词
深度强化学习模型
数字孪生体
服务器信息交互
深度神经网络
策略
噪声功率谱密度
计算方法
波束成形
路径损耗指数
数据
参数
样本
表达式
滑动窗口
因子
能耗
系统为您推荐了相关专利信息
飞行控制系统
传感器系统
光伏面板
清洁控制方法
清洁系统
卷积网络模型
化控制方法
智能超薄
深度确定性策略梯度
冷却系统
社区居家养老
多传感器采集
数据
深度学习算法
策略
零售系统
移动轨迹信息
姿态估计算法
主动学习策略
差分隐私保护机制
联邦学习方法
谐波减速器
中国剩余定理
联邦学习系统
工业机器人