摘要
本申请公开了一种基于客户端的AI模型动态优化以及自适应推理方法,涉及模型优化技术领域,通过对用户端设备的硬件资源和运行环境进行分析,进而选择合适的AI模型部署至用户端设备,再对用户端设备的运行状态信息进行实时监测,从而对AI模型进行动态优化调整以达到高效推理的目的,同时根据用户端设备的硬件资源信息、各推理路径的资源占用量和推理准确率,分析得到一种自适应算法,根据该自适应算法,可实现用户端设备实时调整最优推理路径,进而保证在有限的资源条件下实现最佳的推理性能和效率,最后将各已处理任务及其对应的AI模型和最优推理路径存储至云端以便于后续直接调用。
技术关键词
硬件资源信息
推理方法
分析用户端
客户端
因子
内存
模型优化技术
云端
动态
浮点数
网络
算法
数据
总量
指数
电池
终端设备
基础
系统为您推荐了相关专利信息
性能评估方法
深度预测模型
结构混凝土
试件
模型预测值
变量
二氧化碳排放量
鲸鱼优化算法
神经网络模型
主成分分析法
硬件平台
自动生成方法
深度学习模型
资源消耗量
指数