摘要
本申请适用于计算机技术领域,提供了一种基于共享指数的矩阵乘的文本生成方法、装置及终端设备,包括:获取输入LLM模型文本数据和LLM模型模型参数,再将文本数据和模型参数转换为第一浮点格式数据集,根据预设共享指数算法对第一浮点格式数据集中的每个数据进行指数对齐,生成第二浮点格式数据集,再对第一矩阵和第二矩阵进行矩阵乘运算,生成第三矩阵,再将第三矩阵输入至自注意力机制层输出注意力加权表示,将注意力加权表示输入至前馈神经网络输出高级特征表示,最后将高级特征表示输入解码器中输出文本数据对应的文本。本申请的方法在维持高计算精度的同时,大幅降低原先浮点运算的计算功耗,进一步降低LLM模型的推理延迟,提高文本生成的效率。
技术关键词
矩阵
文本生成方法
指数算法
格式
数据
前馈神经网络
注意力机制
输出模块
文本生成装置
终端设备
输入解码器
可读存储介质
处理器
参数
存储器
系统为您推荐了相关专利信息
车辆行驶数据
判定电路
零知识证明
交通事故责任认定方法
自动驾驶系统
存储设备
备份
设备标识寄存器
地址映射
闪存芯片
可视化管理系统
分区
系统监控
故障预测模型
设备端
测井岩性识别方法
测井深度
强化特征
深度学习模型
注意力机制