摘要
一种基于多智能体强化学习的云边协同视频实时分析方法和装置,其方法包括:1)训练并部署视频分析模型;2)通过随机初始化的RL模型进行系统交互;3)获取云边端状态信息,通过奖励函数得到各边端设备的本地状态和系统全局状态,作为交互经验放入经验池;4)使用迭代式的两阶段训练框架以预设的频率对RL模型进行训练;5)通过多次交互训练,得到具有一定泛化能力并适用于当前环境的最优策略模型,实现视频实时分析。本发明针对云边视频分析场景中因延迟反馈导致的训练偏差和不稳定问题,提出了集中式训练,分布式部署的多代理RL在线训练框架和方法,使边缘设备能够自主适应不断变化的条件。
技术关键词
视频实时分析方法
多智能体强化学习
视频分析
队列
启发式算法
卸载策略
调节器
云端
轨迹
估计误差
阶段
分析装置
框架
网络
处理器
数据
可读存储介质
存储器