一种推理资源优化方法、装置及电子设备

AITNT
正文
推荐专利
一种推理资源优化方法、装置及电子设备
申请号:CN202410942759
申请日期:2024-07-15
公开号:CN118796471B
公开日期:2025-09-30
类型:发明专利
摘要
本申请提供一种推理资源优化方法、装置及电子设备,该方法包括:获取神经网络模型在不同硬件资源下的推理服务响应性能数据,以及在不同硬件资源下的硬件成本数据;对推理服务响应性能数据和硬件成本数据进行优化建模,获得硬件成本最小的硬件资源部署方案;根据硬件成本最小的硬件资源部署方案生成神经网络模型的配置文件;根据配置文件对神经网络模型和不同硬件资源进行自适应调度优化。在上述方案的实现过程中,通过对推理服务响应性能数据和硬件成本数据进行优化建模,并根据获得硬件成本最小的硬件资源部署方案生成的配置文件,对神经网络模型和不同硬件资源进行自适应调度优化,从而有效地提高了硬件资源的利用率。
技术关键词
整数线性规划 服务器内存 资源优化方法 加速器 生成神经网络模型 机器可读指令 参数 资源调度优化 推理服务器 令牌 电子设备 处理器 可读存储介质 数据获取模块 计算机程序产品
系统为您推荐了相关专利信息
1
回旋加速器的粒子速度控制方法和装置
分数阶比例积分控制器 回旋加速器 速度控制方法 RBF神经网络 射频
2
基于大数据的电网能效优化管理平台及方法
能效 网络特征 电网管理 平台 网络吞吐量
3
考虑不确定性自平衡能力的微电网运行域计算方法及系统
联络线功率 微电网 微型燃气轮机 变量 计算方法
4
一种面向森林防火隔离带创建的无人车任务规划方法
无人车 防火隔离带 面向森林防火 网格 火灾
5
水光蓄互补和直流外送两阶段随机优化调度方法及系统
优化调度方法 梯级水电 静态无功补偿器 条件生成对抗网络 两阶段随机优化
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号