摘要
本公开涉及一种基于惩罚机制的安全强化学习任务卸载方法和装置,所述方法包括:接收用户端的计算服务请求;获取用户端当前的状态信息;将状态信息输入到安全强化学习模型,得到针对计算服务请求的决策结果,其中,安全强化学习模型是通过最大化包含障碍函数的目标函数训练得到的,障碍函数用于在安全强化学习模型的训练过程中根据第一约束条件对目标函数值进行惩罚性调整,决策结果为确定将计算服务请求对应的任务卸载到多个服务器中的哪个服务器中进行处理,多个服务器包括云服务器和至少一个边缘服务器;基于决策结果对计算服务请求对应的任务进行卸载。障碍函数能够自动触发预先惩罚机制,有效避免违规行为的发生。
技术关键词
强化学习模型
卸载方法
策略
决策
机制
云服务器
阶段
处理器
计算机可执行指令
卸载装置
计算机程序产品
可读存储介质
索引
参数
能耗
电子设备
存储器
系统为您推荐了相关专利信息
政务
检索系统
卷积神经网络模型
复杂度特征
循环神经网络模型
脑肿瘤分割方法
图像数据集合
半监督学习
解码器
可视化模块
泄漏检测定位
数字孪生模型
策略优化模型
云数据中心
燃气管道泄漏检测