模型推理进程组构建方法及模型推理方法

AITNT
正文
推荐专利
模型推理进程组构建方法及模型推理方法
申请号:CN202410758433
申请日期:2024-06-12
公开号:CN118520955A
公开日期:2024-08-20
类型:发明专利
摘要
本申请提供一种模型推理进程组构建方法及模型推理方法。该方法包括:接收待推理模型的M个模型推理请求,并将M个所述模型推理请求缓存至第一共享变量中。根据M个所述模型推理请求的等待时长,以及,动态合批进程的批次数量上限,将M个所述模型推理请求动态合批为若干个批量请求集合。将若干个所述批量请求集合输入模型推理进程组中,生成若干个所述批量请求集合对应的模型推理结果,所述模型推理进程组通过3D并行地方式进行模型推理。输出所述模型推理结果。本申请的方法,增加了分布式推理大型深度学习模型的资源利用率。
技术关键词
进程 推理系统 节点 推理方法 计算机执行指令 批量 通信接口 变量 动态 推理装置 深度学习模型 存储器 控制模块 处理器 外部设备 输出模块 流水线 参数 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号