摘要
本发明提供基于强化学习的私域直播带宽资源分配与路由方法及系统,涉及计算机网络技术领域,包括采集直播间用户数量、地理分布、终端类型、内容类型、网络延迟、丢包率、带宽利用率等实时数据,输入预训练的强化学习模型;模型基于状态空间,利用深度神经网络提取特征并结合带宽资源约束,采用策略梯度算法生成带宽分配和路由策略;根据策略,软件定义网络控制器实时调整带宽分配参数和路由表配置,实现差异化带宽分配和路径优化,并基于用户地理分布建立就近接入边缘节点,拥塞时动态调整路径。
技术关键词
系统资源利用率
强化学习模型
决策
策略
压缩特征向量
梯度算法
实时数据
资源分配
资源约束条件
注意力
参数化技术
深度神经网络
多层感知机
节点
网络拓扑
链路
区域控制器失效
系统为您推荐了相关专利信息
飞行动力学模型
学习训练方法
控制策略
强化学习算法
学习训练系统
互动方法
分区策略
时间序列模型系数
交互区域划分
系统响应速度
情感分析装置
情感分析方法
文本
融合特征
融合策略