摘要
本申请实施例提供了基于大模型量化的文本生成方法、装置、设备及存储介质,应用于昇腾计算架构。通过将原始文本输入至目标大语言模型,目标大语言模型包括多个依次级联的特征提取层,每个特征提取层包括全连接层,通过目标大语言模型中的多个依次级联的特征提取层,基于原始文本对应的文本特征进行逐层级递增的特征提取,并配合昇腾计算架构的量化方法对每个特征提取层中全连接神经元的权重参数和激活值进行量化处理,输出目标文本特征,以简化全连接阶段的计算,从而实现大语言模型下的轻量级计算。基于目标文本特征生成目标文本,通过利用轻量级的大语言模型进行文本生成任务,减少了大模型在文本推理过程中的复杂计算,提高了文本生成的效率。
技术关键词
大语言模型
文本生成方法
参数
注意力
层级
级联
文本生成装置
可读存储介质
特征提取模块
电子设备
处理器
输入模块
存储器
计算机
基础
数据
阶段
系统为您推荐了相关专利信息
优化调度模型
配电网变压器
管控方法
日内滚动优化
寿命
梅花动触头
融合传感器
压力检测传感器
温度检测传感器
手车断路器
智能评价方法
对话语义分析
特征提取技术
上下文感知技术
语音识别技术
智能体模型
布线方法
训练智能体
预训练模型
注意力机制
场景呈现方法
大语言模型
焦点
资源调度优化
标注工具