边缘计算环境中部署混合专家模型的优化方法及相关设备

AITNT
正文
推荐专利
边缘计算环境中部署混合专家模型的优化方法及相关设备
申请号:CN202411926899
申请日期:2024-12-25
公开号:CN119721178B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种边缘计算环境中部署混合专家模型的优化方法及相关设备,通过预先训练好的优化模型,接收各用户的推理请求,并输出这些请求向各边缘服务器的分配方案,以及各服务器的专家混合量化位宽方案。优化模型的训练过程包括:收集用户推理请求,构建预训练数据,预训练数据包括随机生成的推理请求分配和对应的专家混合量化位宽;利用这些数据预训练强化学习中的策略网络;将用户推理请求输入初始化策略网络,得到分配方案和量化位宽方案;根据这些方案对用户推理请求进行服务,得到服务质量,并将其作为策略网络的奖励,迭代更新网络参数,直至服务质量达到预设要求。本发明旨在通过动态调整边缘服务器的专家量化比特宽度,并结合用户推理请求的分配优化,实现高精度、低延迟的边缘推理服务。
技术关键词
边缘计算环境 服务器 策略 决策 频率 更新网络参数 数据 可读存储介质 时延 处理器 优化装置 低延迟 总量 精度 存储器 计算机 模块 标签
系统为您推荐了相关专利信息
1
高风险作业智能视频检测方法及系统
视频检测方法 作业智能 高风险 佩戴安全帽 图像处理
2
基于储能与变压器动态负荷管理的充电站扩容系统及方法
电池储能模块 动态负荷管理 储能系统充放电 变压器 扩容系统
3
一种行人定位方法及装置
历史轨迹数据 行人定位方法 强化学习模型 终端设备 节点
4
一种基于分布式鲁棒性的干支通运输网络优化方法
混合启发式算法 选址模型 鲁棒性 变量 通用航空飞行器
5
一种基于AI的无人机停机调度系统
无人机 调度系统 回放模块 更新系统 状态更新
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号