基于大模型量化的文本生成方法、装置、设备及存储介质

AITNT
正文
推荐专利
基于大模型量化的文本生成方法、装置、设备及存储介质
申请号:CN202510058078
申请日期:2025-01-13
公开号:CN120087360B
公开日期:2025-12-09
类型:发明专利
摘要
本申请实施例提供了基于大模型量化的文本生成方法、装置、设备及存储介质,应用于昇腾计算架构。通过将原始文本输入至目标大语言模型,目标大语言模型包括多个依次级联的特征提取层,每个特征提取层包括全连接层,通过目标大语言模型中的多个依次级联的特征提取层,基于原始文本对应的文本特征进行逐层级递增的特征提取,并配合昇腾计算架构的量化方法对每个特征提取层中全连接神经元的权重参数和激活值进行量化处理,输出目标文本特征,以简化全连接阶段的计算,从而实现大语言模型下的轻量级计算。基于目标文本特征生成目标文本,通过利用轻量级的大语言模型进行文本生成任务,减少了大模型在文本推理过程中的复杂计算,提高了文本生成的效率。
技术关键词
大语言模型 文本生成方法 参数 注意力 层级 级联 文本生成装置 可读存储介质 特征提取模块 电子设备 处理器 输入模块 存储器 计算机 基础 数据 阶段
系统为您推荐了相关专利信息
1
配电网变压器协调管控方法、系统、电子设备及存储介质
优化调度模型 配电网变压器 管控方法 日内滚动优化 寿命
2
梅花动触头多参数融合传感器及传感器信息反馈分析方法
梅花动触头 融合传感器 压力检测传感器 温度检测传感器 手车断路器
3
基于实时会话和多模态大模型的智能评价方法及装置
智能评价方法 对话语义分析 特征提取技术 上下文感知技术 语音识别技术
4
一种基于多级斯坦纳树的船舶电气布线方法及系统
智能体模型 布线方法 训练智能体 预训练模型 注意力机制
5
基于大语言模型的LOD渲染效果自适应场景呈现方法及装置
场景呈现方法 大语言模型 焦点 资源调度优化 标注工具
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号