一种基于大语言模型上下文压缩的长文本生成方法

正文

推荐专利

申请号：CN202411564900

申请日期：2024-11-05

公开号：CN119761306B

公开日期：2025-12-05

类型：发明专利

摘要

本发明提供一种基于大语言模型上下文压缩的长文本生成方法，方法包括：获取待压缩的上下文文本以及提示词文本，并进行基于压缩的编码处理，得到对应的压缩向量以及提示词嵌入向量；将压缩向量与提示词嵌入向量进行拼接，并对拼接得到的融合特征进行基于自回归的解码处理，得到对应的多个token标识符；根据预设的词表，将token标识符逐一地映射为文本字符串，并将文本字符串组成为压缩上下文文本。通过本申请，将大语言模型处理的上下文长文本进行压缩，解决现有技术中语义模型处理长上下文文本时需要消耗巨大的模型计算资源和数据存储资源的技术问题。

技术关键词

文本生成方法大语言模型标识符解码模型词嵌入向量压缩单元融合特征样本非暂态计算机可读存储介质数据存储资源文本生成装置编码处理器模型压缩多层感知机计算机程序产品参数

系统为您推荐了相关专利信息

微机联锁设备的通信方法、系统、装置、设备和存储介质

IO板卡通信板报文通信方法继电器

一种面向网络商品直播销售的实时监测系统

直播视频数据实时监测系统线索统计语言模型大语言模型

基于声学信号的风力发电机传动链故障识别方法及系统

风力发电机传动链故障识别方法风力发电机故障声音采集器声波

可视化界面构建方法、装置、设备及存储介质

生成可视化界面生成业务文档编辑工具前端组件代码编辑器

一种人员评价数据处理方法及系统

评价数据处理方法贝叶斯网络模型语义标签图谱标识符

一种基于大语言模型上下文压缩的长文本生成方法

站点导航

APP 下载