摘要
本申请涉及视频流传输技术领域,涉及一种基于专家指导的视频流媒体比特率自适应方法和系统。所述方法包括:获取混合吞吐量轨迹数据集,根据数据集训练得到初始模型;将数据集聚类为子集,在每个子集上训练专家模型,记录各专家模型的状态‑动作决策对并存入专家经验池;生成虚拟视频会话,收集传输过程中每个视频片段的状态‑动作‑奖励三元组;计算累计奖励和优势值,组合状态‑动作‑奖励三元组、累计奖励、优势值、专家模型的状态‑动作决策对构成训练元组;采样训练元组同步优化Actor网络和Critic网络,获取通用型ABR模型。本发明通过多专家指导方法解决了ABR算法的灾难性遗忘问题,提升了模型的泛化能力和自适应性能。
技术关键词
Actor模型
媒体
决策
三元组
视频流传输技术
网络特征
视频块
无监督聚类
深度强化学习
模型预训练
客户端
视频服务器
轨迹
通用型
会话
数据
系统为您推荐了相关专利信息
网络访问控制系统
访问特征数据
历史访问记录
企业级
访问控制模块
金融风险评估方法
智能优化算法
综合风险指标
金融风险评估系统
风险评估模型
动态
卷积神经网络加速
智能分区管理
片上网络架构
功耗
运动分析系统
运动模式识别
动态时间规整算法
三维残差网络
动态邻接矩阵
无人机路径规划
无人机集群
无人机飞行状态
路径规划方法
飞行状态数据