摘要
本发明涉及一种推理加速方法、装置和设备,涉及人工智能技术领域,该方法、装置和设备,采用本发明实施例提供的技术方案,通过设置动态调度模块,在解析任务请求后,通过设定的连续批处理算法,实现对资源的动态调节,解决了现有技术中调度能力受限,造成算力浪费的技术问题。其中,通过以最小化总延迟和最大化资源利用率为联合优化目标,进行连续批处理算法的改进,提升了调度能力。
技术关键词
最大化资源利用率
资源分配策略
硬件资源利用率
队列
集群
异构
时间序列预测模型
加速库
中间件
解码
资源监控
加速设备
人工智能技术
加速装置
存储器
动态
处理器
模块
系统为您推荐了相关专利信息
智能集群控制系统
太阳能路灯
工作状态数据
前馈神经网络
数据采集模块
运维监控方法
节点运行状态
智能运维监控系统
告警规则
指标
多线程并行处理
精简方法
消息
精简系统
优化查询执行计划
数据库查询方法
大语言模型
超参数优化方法
自然语言转换
医院