摘要
本公开涉及用于大模型的分布式推理方法及电子设备。本发明涉及一种用于大模型的分布式推理的电子设备。该电子设备包括一个或多个存储器和一个或多个处理器,其中,一个或多个处理器基于深度学习模型和与深度学习模型相关联的输入数据,将存储在一个或多个存储器中的深度学习模型分割成多个子模型,基于多个子模型中的每个子模型的输入数据,将多个子模型分布及调度到内部资源设备和外部资源设备,从内部资源设备和外部资源设备接收每个子模型的推理结果,以及通过接收到的推理结果计算深度学习模型的结果。
技术关键词
分布式推理方法
深度学习模型
资源
数据吞吐量
电子设备
处理器
存储器
尺寸
系统为您推荐了相关专利信息
智能监控方法
优先级调度算法
数据采集终端
资源消耗量
参数
泵站机组
实时数据
优化调度模型
水泵机组
数字孪生模型
时间序列预测模型
网络模块
诊断方法
预测误差
基础设施结构
关键词拓展方法
预训练模型
语义向量
文本
分词词典