基于多目标强化学习的自适应拥塞控制方法、设备及介质

正文

推荐专利

申请号：CN202510963684

申请日期：2025-07-14

公开号：CN120750853A

公开日期：2025-10-03

类型：发明专利

摘要

本发明提出了一种基于多目标强化学习的自适应拥塞控制方法，包括以下步骤：建立延迟动作的多目标马尔可夫决策过程MOMDP：在马尔可夫决策过程中引入偏好空间Ω和偏好函数fΩ；fΩ用于将所选指标偏好w∈Ω转化为指标标量；指标偏好表示指标的权重向量；将拥塞控制问题建模为MOMDP；基于强化学习算法，训练Actor‑Critic网络，经过训练的Actor网络学习出的策略即为智能体的最优控制策略；其中，Actor‑Critic网络以状态和指标偏好作为输入。本发明为双端全效连接迁移过程提供灵活动态的流量控制处理方案，确保端到端网络信息传输的高效性和及时性。本发明还提出了一种终端设备、计算机可读存储介质。

技术关键词

拥塞控制方法指标网络强化学习算法策略可读存储介质参数终端设备决策处理器更新方法计算机基线因子批量存储器关系样本动态

系统为您推荐了相关专利信息

考虑综合市场服务及投资收益风险的用户侧储能配置综合评估方法

综合评估方法储能优化配置风险指标遗传算法求解

一种无人机密集飞行避碰方法、电子设备及无人机

无人机避碰方法动作预测模型决策电子设备

基于BIM的建筑数据智能处理方法、装置、设备及介质

BIM建筑模型数据验证 BIM模型数据数据完整性校验报告

一种基于大模型的掩码增强命名实体识别方法

命名实体识别方法掩码策略条件随机场模型 BERT模型序列

多策略加密的交易数据处理方法、系统、设备及存储介质

交易数据处理方法加密策略数据安全性混合加密算法非对称加密算法

基于多目标强化学习的自适应拥塞控制方法、设备及介质

站点导航

APP 下载