摘要
本发明公开了一种基于深度强化学习的人工智能生成内容任务多服务器协同优化方法,涉及边缘计算与人工智能交叉领域。该方法构建“用户设备‑基站‑边缘服务器‑核心网络”四层架构,通过深度Q网络模型实现分布式决策,核心包括:定义任务与时延模型;设计深度强化学习框架,通过状态空间、动作空间和奖励函数构建决策模型,采用经验回放和目标网络慢更新机制提升训练稳定性;提出自适应多服务器选择与负载分配策略,基于时延相等原则求解最优分配比例。本发明显著降低AIGC任务的平均卸载时延,减少任务失败率,提升动态环境适应性和极端场景鲁棒性,适用于对时延和可靠性要求较为严苛的场景。
技术关键词
深度强化学习
时延
协同优化方法
深度Q网络
基站
贪心策略
服务器负载状态
队列
构建决策模型
核心
分配单元
动态
时间片
机制
调度器
定义
系统为您推荐了相关专利信息
Hopfield神经网络
装备
深度强化学习
决策系统
资源
稀疏信道估计方法
广义近似消息传递
延迟多普勒
超参数
矩阵