摘要
本发明公开了一种基于迁移强化学习的扩散模型边端协同推理方法及装置,包括:构建包括若干用户终端和边缘设备的图像任务处理系统,边缘设备包括主节点和若干辅助节点;将主节点接收到的任务卸载决策优化问题描述为马尔可夫决策过程,马尔可夫决策过程包括状态空间、动作空间和奖励函数;基于DDQN网络在主节点构建任务卸载决策模型;主节点对任务卸载决策模型进行训练,根据训练后的任务卸载决策模型生成最优卸载决策;主节点根据最优卸载决策将接收到的任务发送到对应的边缘和/或用户终端,边缘和/或本地终端分别利用基于U‑ViT模型构建的图像生成模型处理任务。本发明实现了任务在本地和边缘间的智能动态分配,提高了资源利用率。
技术关键词
图像生成模型
决策
推理方法
编码模块
主节点
终端
网络
判别模块
数据收集模块
图像处理模块
图像嵌入
推理装置
贪婪策略
周期
表达式
参数