摘要
本申请涉及计算机技术领域,公开一种设备模型部署方法,包括:根据端侧设备的硬件特性和/或应用场景,对待部署模型进行压缩处理,以获得轻量级目标模型;基于模型推理框架,动态分配轻量级目标模型的处理任务;其中,模型推理框架和轻量级目标模型部署于端侧设备。该方法在减少目标模型的复杂度和运行功耗的同时,最大限度保持模型的性能;从而保证端侧设备硬件资源的充分利用且有助于提升性能。本申请还公开一种设备模型部署装置、端侧设备及计算机可读存储介质。
技术关键词
模型部署方法
数据总线设备
图形处理器
框架
可读存储介质
中央处理器
压力
模型压缩
计算机
场景
程序
指令
网络结构
内存
复杂度
功耗
存储器
动态
系统为您推荐了相关专利信息
电价预测方法
数据
卷积神经网络模块
注意力模型
矩阵
有向无环图
任务调度方法
任务调度系统
深度强化学习
决策
图像
人体动作检测方法
人体再识别
视频帧
检测器
报文协议
神经网络模型
接口
大语言模型
机器可读指令