基于多目标强化学习的自适应拥塞控制方法、设备及介质

AITNT
正文
推荐专利
基于多目标强化学习的自适应拥塞控制方法、设备及介质
申请号:CN202510963684
申请日期:2025-07-14
公开号:CN120750853A
公开日期:2025-10-03
类型:发明专利
摘要
本发明提出了一种基于多目标强化学习的自适应拥塞控制方法,包括以下步骤:建立延迟动作的多目标马尔可夫决策过程MOMDP:在马尔可夫决策过程中引入偏好空间Ω和偏好函数fΩ;fΩ用于将所选指标偏好w∈Ω转化为指标标量;指标偏好表示指标的权重向量;将拥塞控制问题建模为MOMDP;基于强化学习算法,训练Actor‑Critic网络,经过训练的Actor网络学习出的策略即为智能体的最优控制策略;其中,Actor‑Critic网络以状态和指标偏好作为输入。本发明为双端全效连接迁移过程提供灵活动态的流量控制处理方案,确保端到端网络信息传输的高效性和及时性。本发明还提出了一种终端设备、计算机可读存储介质。
技术关键词
拥塞控制方法 指标 网络 强化学习算法 策略 可读存储介质 参数 终端设备 决策 处理器 更新方法 计算机 基线 因子 批量 存储器 关系 样本 动态
系统为您推荐了相关专利信息
1
考虑综合市场服务及投资收益风险的用户侧储能配置综合评估方法
综合评估方法 储能优化配置 风险 指标 遗传算法求解
2
一种无人机密集飞行避碰方法、电子设备及无人机
无人机 避碰方法 动作预测模型 决策 电子设备
3
基于BIM的建筑数据智能处理方法、装置、设备及介质
BIM建筑模型 数据验证 BIM模型数据 数据完整性校验 报告
4
一种基于大模型的掩码增强命名实体识别方法
命名实体识别方法 掩码策略 条件随机场模型 BERT模型 序列
5
多策略加密的交易数据处理方法、系统、设备及存储介质
交易数据处理方法 加密策略 数据安全性 混合加密算法 非对称加密算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号