摘要
本发明公开了一种边缘计算场景中大模型智能体的推理卸载方法、系统及介质,方法包括将待处理的目标大模型任务输入预先构建的Transformer‑PPO模型以得到相应的目标卸载方案用于将目标大模型任务分解为多个目标子任务并确定相应的卸载决策,模型建立过程包括利用Transformer网络将大模型任务得到一有向无环图的推理链;基于PPO算法生成推理链的包括各个子任务的卸载策略的卸载方案,卸载策略为子任务的卸载决策及卸载决策的概率;通过惩罚和/或奖励上一轮训练中增加和/或降低总延迟的卸载策略以得到本轮训练中的卸载方案。本发明能够得到更优的大模型任务的推理卸载方案,提升大模型任务的处理效率、降低设备能耗。
技术关键词
卸载方法
卸载策略
决策
场景
策略更新
链路
神经网络参数
有向无环图
存储程序指令
卸载系统
算法
基础
终点
可读存储介质
速率
服务器
系统为您推荐了相关专利信息
场景
规则创建方法
列表
大语言模型
智慧家庭技术
人机系统
面向无人机
人机功能
无人机模型
监测无人机
移动终端
控制车载设备
人机交互信息
电子设备
场景
表格信息提取方法
大语言模型
图像
信息提取系统
视觉