摘要
本发明公开一种基于跨域边缘设备协同的大模型推理方法及装置,方法包括:基于分布式哈希表动态感知多个工作节点中图形处理器的可用资源情况,根据所述可用资源情况将大模型分块分配至所述工作节点;所述可用资源情况表征未分配的工作节点集;接收用户推理请求,所述推理请求中至少包括一个或多个推理任务;基于所述工作节点分配的大模型分块,将所述推理任务分配至一个或多个管理节点;每个所述管理节点所在区域包括一个工作节点集;所述管理节点将所述推理任务分配至本区域的所述工作节点集以进行推理;所述工作节点集包括多个工作节点。通过上述方法及装置不仅可以提升分布式推理任务的效率,还能实现资源的灵活分配和系统的高可靠性。
技术关键词
跨域边缘设备
节点
推理方法
分布式哈希表
图形处理器
分块
资源
分配单元
批量
推理装置
可读存储介质
动态
传输路径
处理单元
计算机
程序
网络
时延
队列
瓶颈
系统为您推荐了相关专利信息
路径校正方法
山地机械
像素点
三维地形模型
Prewitt算子
科技项目评估方法
结构增强型
模糊层次分析法
注意力神经网络
矩阵