基于惩罚机制的安全强化学习任务卸载方法和装置

正文

推荐专利

申请号：CN202411874791

申请日期：2024-12-18

公开号：CN119311334B

公开日期：2025-03-25

类型：发明专利

摘要

本公开涉及一种基于惩罚机制的安全强化学习任务卸载方法和装置，所述方法包括：接收用户端的计算服务请求；获取用户端当前的状态信息；将状态信息输入到安全强化学习模型，得到针对计算服务请求的决策结果，其中，安全强化学习模型是通过最大化包含障碍函数的目标函数训练得到的，障碍函数用于在安全强化学习模型的训练过程中根据第一约束条件对目标函数值进行惩罚性调整，决策结果为确定将计算服务请求对应的任务卸载到多个服务器中的哪个服务器中进行处理，多个服务器包括云服务器和至少一个边缘服务器；基于决策结果对计算服务请求对应的任务进行卸载。障碍函数能够自动触发预先惩罚机制，有效避免违规行为的发生。

技术关键词

强化学习模型卸载方法策略决策机制云服务器阶段处理器计算机可执行指令卸载装置计算机程序产品可读存储介质索引参数能耗电子设备存储器

系统为您推荐了相关专利信息

一种政务文件智能分类与检索系统

政务检索系统卷积神经网络模型复杂度特征循环神经网络模型

一种基于素数阶循环群的适配密钥生成方法及系统

密钥生成方法生成密钥加密参数密钥生成效率

一种基于半监督学习的脑肿瘤分割方法及脑肿瘤分割系统

脑肿瘤分割方法图像数据集合半监督学习解码器可视化模块

一种燃气管道泄漏检测系统及方法

泄漏检测定位数字孪生模型策略优化模型云数据中心燃气管道泄漏检测

虚拟同步发电机参数确定方法及设备

虚拟同步发电机网络参数频率电子设备

基于惩罚机制的安全强化学习任务卸载方法和装置

站点导航

APP 下载