边缘计算环境中部署混合专家模型的优化方法及相关设备

正文

推荐专利

申请号：CN202411926899

申请日期：2024-12-25

公开号：CN119721178B

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了一种边缘计算环境中部署混合专家模型的优化方法及相关设备，通过预先训练好的优化模型，接收各用户的推理请求，并输出这些请求向各边缘服务器的分配方案，以及各服务器的专家混合量化位宽方案。优化模型的训练过程包括：收集用户推理请求，构建预训练数据，预训练数据包括随机生成的推理请求分配和对应的专家混合量化位宽；利用这些数据预训练强化学习中的策略网络；将用户推理请求输入初始化策略网络，得到分配方案和量化位宽方案；根据这些方案对用户推理请求进行服务，得到服务质量，并将其作为策略网络的奖励，迭代更新网络参数，直至服务质量达到预设要求。本发明旨在通过动态调整边缘服务器的专家量化比特宽度，并结合用户推理请求的分配优化，实现高精度、低延迟的边缘推理服务。

技术关键词

边缘计算环境服务器策略决策频率更新网络参数数据可读存储介质时延处理器优化装置低延迟总量精度存储器计算机模块标签

系统为您推荐了相关专利信息

高风险作业智能视频检测方法及系统

视频检测方法作业智能高风险佩戴安全帽图像处理

基于储能与变压器动态负荷管理的充电站扩容系统及方法

电池储能模块动态负荷管理储能系统充放电变压器扩容系统

一种行人定位方法及装置

历史轨迹数据行人定位方法强化学习模型终端设备节点

一种基于分布式鲁棒性的干支通运输网络优化方法

混合启发式算法选址模型鲁棒性变量通用航空飞行器

一种基于AI的无人机停机调度系统

无人机调度系统回放模块更新系统状态更新

边缘计算环境中部署混合专家模型的优化方法及相关设备

站点导航

APP 下载