摘要
本申请实施例公开了一种模型处理方法、装置、计算机、存储介质及程序产品,该方法包括:在第一业务处理网络中,将通过第一投影矩阵对业务数据的第一业务隐藏状态压缩后的业务隐向量,添加至键值缓存中;对通过第二投影矩阵对业务隐向量转换后的第一键向量与第一值向量进行注意力处理,得到第二业务隐藏状态;将第一键向量、第一值向量及业务隐向量中的跨层转移参数,传递至第二业务处理网络,基于第二业务隐藏状态对通过跨层转移参数确定的第二键向量与第二值向量进行注意力处理,得到第三业务隐藏状态;对最后一个业务处理网络得到的业务隐藏状态进行信息还原,得到业务处理结果。采用本申请,可以减少模型显存占用量,提高模型部署效率。
技术关键词
样本
矩阵
注意力
网络
键值
参数
业务处理结果
输入输出接口
基础
计算机设备
数据
处理器
对象
存储器
模型训练模块
可读存储介质
存储计算机程序
文本
系统为您推荐了相关专利信息
无人机图像配准
多尺度特征
关键点
定位方法
RANSAC算法
变频空气源热泵
频率控制策略
干式变压器
时空注意力机制
图谱
协同运动控制
多模态感知系统
三自由度运动
机器鱼
频率