一种边缘计算场景中大模型智能体的推理卸载方法、系统及介质

正文

推荐专利

申请号：CN202411857975

申请日期：2024-12-16

公开号：CN119861982B

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种边缘计算场景中大模型智能体的推理卸载方法、系统及介质，方法包括将待处理的目标大模型任务输入预先构建的Transformer‑PPO模型以得到相应的目标卸载方案用于将目标大模型任务分解为多个目标子任务并确定相应的卸载决策，模型建立过程包括利用Transformer网络将大模型任务得到一有向无环图的推理链；基于PPO算法生成推理链的包括各个子任务的卸载策略的卸载方案，卸载策略为子任务的卸载决策及卸载决策的概率；通过惩罚和/或奖励上一轮训练中增加和/或降低总延迟的卸载策略以得到本轮训练中的卸载方案。本发明能够得到更优的大模型任务的推理卸载方案，提升大模型任务的处理效率、降低设备能耗。

技术关键词

卸载方法卸载策略决策场景策略更新链路神经网络参数有向无环图存储程序指令卸载系统算法基础终点可读存储介质速率服务器

系统为您推荐了相关专利信息

场景规则创建方法、装置、设备及存储介质

场景规则创建方法列表大语言模型智慧家庭技术

一种面向无人机群人机系统的任务自适应分配方法

人机系统面向无人机人机功能无人机模型监测无人机

蓝牙连接方法、装置、电子设备、存储介质和载具平台

移动终端控制车载设备人机交互信息电子设备场景

一种基于加工大数据的加工智能控制系统及方法

智能控制系统大数据客户场景位置识别

PDF无线表格信息提取方法、系统、介质及电子设备

表格信息提取方法大语言模型图像信息提取系统视觉

一种边缘计算场景中大模型智能体的推理卸载方法、系统及介质

站点导航

APP 下载