用于大模型的分布式推理方法及电子设备

AITNT
正文
推荐专利
用于大模型的分布式推理方法及电子设备
申请号:CN202510521259
申请日期:2025-04-24
公开号:CN120832946A
公开日期:2025-10-24
类型:发明专利
摘要
本公开涉及用于大模型的分布式推理方法及电子设备。本发明涉及一种用于大模型的分布式推理的电子设备。该电子设备包括一个或多个存储器和一个或多个处理器,其中,一个或多个处理器基于深度学习模型和与深度学习模型相关联的输入数据,将存储在一个或多个存储器中的深度学习模型分割成多个子模型,基于多个子模型中的每个子模型的输入数据,将多个子模型分布及调度到内部资源设备和外部资源设备,从内部资源设备和外部资源设备接收每个子模型的推理结果,以及通过接收到的推理结果计算深度学习模型的结果。
技术关键词
分布式推理方法 深度学习模型 资源 数据吞吐量 电子设备 处理器 存储器 尺寸
系统为您推荐了相关专利信息
1
工程项目进度智能监控方法及系统
智能监控方法 优先级调度算法 数据采集终端 资源消耗量 参数
2
一种基于数字孪生的泵站调节方法、装置及电子设备
泵站机组 实时数据 优化调度模型 水泵机组 数字孪生模型
3
一种基于条件扩散模型的交通基础设施监测数据概率异常值诊断方法
时间序列预测模型 网络模块 诊断方法 预测误差 基础设施结构
4
一种DRG分组方法及装置、电子设备和存储介质
DRG分组方法 字段 算法 报告 电子设备
5
基于预训练模型的关键词拓展方法及装置
关键词拓展方法 预训练模型 语义向量 文本 分词词典
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号