摘要
本申请公开了一种模型轻量化方法及电子设备,涉及人工智能技术领域,包括将输入序列划分为多个数据块;基于数据块与多个专家模块的匹配度,确定数据块的路由向量,进而确定每个设备待处理的目标数据块,提高了资源利用率;针对任一远程设备待处理的目标数据块,确定该目标数据块相对于共享基础参数的差异参数,以生成残差数据块,获得聚合请求包,该远程设备基于聚合请求包进行推理,在减少数据传输量的同时,确保推理精度;基于目标专家模块对数据块的推理结果,确定数据块的目标推理结果。解决了相关技术中实现大模型轻量化的方式降低了推理精度的技术问题,达到了在实现大模型轻量化的同时确保推理精度的技术效果。
技术关键词
远程设备
模块
残差数据
轻量化方法
参数
矩阵
资源
共享字典
电子设备
存储计算机程序
人工智能技术
索引
校正
精度
基础
序列
入口
时间段
系统为您推荐了相关专利信息
航空航天结构
融合方法
传感器布置
有限元仿真分析
层级
语义特征
分析方法
融合特征
文本
计算机可读指令
太阳能光热发电
蒸汽回路
储热模块
供电系统
发电模块
无人船控制系统
远程控制器
远程服务器
主控芯片
地面控制系统