摘要
本申请公开一种模型推理方法、模型量化方法和电子设备,涉及人工智能技术领域,所公开的模型推理方法包括:获得待处理任务和模型量化数据;模型量化数据包括:对第一模型中第一网络层所对应至少一个第一权重块进行量化所得的至少一个第一量化权重,第一模型中第二网络层所对应至少一个第二权重块中目标第二权重块与各第一权重块中目标第一权重块之间的映射关系信息;目标第二权重块和目标第一权重块分别对应的量化权重满足相似条件;基于映射关系信息,确定所述至少一个第一量化权重中与目标第二权重块对应的目标第二量化权重满足相似条件的目标第一量化权重;在第二网络层至少基于目标第一量化权重对待处理任务进行推理,以生成任务处理结果。
技术关键词
推理方法
计算机指令集
数据
参数
电子设备
人工智能技术
关系
分块
存储器
处理器
系统为您推荐了相关专利信息
网络评论数据
情感特征
语义特征
谣言检测方法
融合语义
负荷预测方法
负荷预测系统
模型预测值
编码器训练
学生
监控装置
水利监控
水质检测传感器
泵站
数据处理模块
故障诊断模型
故障检测方法
中间件
随机森林
指标