摘要
本发明提供一种基于大语言模型上下文压缩的长文本生成方法,方法包括:获取待压缩的上下文文本以及提示词文本,并进行基于压缩的编码处理,得到对应的压缩向量以及提示词嵌入向量;将压缩向量与提示词嵌入向量进行拼接,并对拼接得到的融合特征进行基于自回归的解码处理,得到对应的多个token标识符;根据预设的词表,将token标识符逐一地映射为文本字符串,并将文本字符串组成为压缩上下文文本。通过本申请,将大语言模型处理的上下文长文本进行压缩,解决现有技术中语义模型处理长上下文文本时需要消耗巨大的模型计算资源和数据存储资源的技术问题。
技术关键词
文本生成方法
大语言模型
标识符
解码模型
词嵌入向量
压缩单元
融合特征
样本
非暂态计算机可读存储介质
数据存储资源
文本生成装置
编码
处理器
模型压缩
多层感知机
计算机程序产品
参数
系统为您推荐了相关专利信息
直播视频数据
实时监测系统
线索
统计语言模型
大语言模型
风力发电机传动链
故障识别方法
风力发电机故障
声音采集器
声波
生成可视化界面
生成业务
文档编辑工具
前端组件
代码编辑器
评价数据处理方法
贝叶斯网络模型
语义标签
图谱
标识符