摘要
本申请公开了一种基于大模型的推理方法及相关设备,涉及人工智能技术领域,包括:响应于推理指令,获取场景图片数据,基于预设大语言模型相应粒度的量化方式,对所述场景图片数据执行量化操作,得到目标图像数据,基于更改部署方式后的所述预设大语言模型的推理量化流程,对所述目标图像数据进行推理量化,得到推理量化结果,其中,所述更改部署方式后所对应的推理量化流程比更改部署方式前推理量化流程的计算量更小。本申请使用计算量更小的推理量化流程所对应的部署方式部署预设大语言模型,减少推理量化过程中的计算量,提高推理效率。
技术关键词
大语言模型
推理方法
图片
数据
超参数
推理装置
图像
计算机程序产品
场景
人工智能技术
处理器
模块
计算方法
可读存储介质
指令
存储器
样本
因子
系统为您推荐了相关专利信息
多维监测
数据分析模块
数据管理模块
嵌入式处理器
基础医学研究
关键特征提取方法
资产
多头注意力机制
加权特征
电力
紫花苜蓿
植株磷含量
菌肥
滴灌施肥系统
传感器设备