摘要
本发明提供了一种基于协同多点传输和深度强化学习的资源分配方法、系统及存储介质,该资源分配方法包括:步骤1:引入针对URLLC用户的BLER中断概率,将eMBB和URLLC联合资源分配问题建模为CMDP问题;步骤2:采用基于约束修正策略优化的孪生延迟深度确定性策略梯度算法,通过线下训练,使算法在线上能利用前向传播以低复杂度找到最优资源分配策略,降低算法的处理时延。本发明的有益效果是:能满足多蜂窝网络下的URLLC时延与可靠性要求,能在高移动性场景中满足URLLC的QoS指标。同时,通过动态调控URLLC导频长度和数据传输符号数,能有效降低eMBB用户性能因URLLC用户抢占资源而受到的衰减。
技术关键词
资源分配方法
协同多点传输
信道估计误差
深度强化学习
深度确定性策略梯度
资源分配策略
时延
符号持续时间
资源分配系统
随机梯度下降
算法
深度神经网络
可读存储介质
代表
存储器
系统为您推荐了相关专利信息
决策方法
雷达工作模式
策略
卡尔曼滤波估计
三自由度运动
智能体模型
生成规则
教育知识图谱
生成方法
大语言模型
自主定位方法
无人机航迹
模型预测控制算法
无人机飞行路径
信号强度监测
氧合装置
基础生命体征
深度强化学习
控制策略模型
电机驱动滑块
智能电源管理
功率分配策略
深度强化学习算法
音频
分数阶微分算子