一种基于大语言模型上下文压缩的长文本生成方法

AITNT
正文
推荐专利
一种基于大语言模型上下文压缩的长文本生成方法
申请号:CN202411564900
申请日期:2024-11-05
公开号:CN119761306B
公开日期:2025-12-05
类型:发明专利
摘要
本发明提供一种基于大语言模型上下文压缩的长文本生成方法,方法包括:获取待压缩的上下文文本以及提示词文本,并进行基于压缩的编码处理,得到对应的压缩向量以及提示词嵌入向量;将压缩向量与提示词嵌入向量进行拼接,并对拼接得到的融合特征进行基于自回归的解码处理,得到对应的多个token标识符;根据预设的词表,将token标识符逐一地映射为文本字符串,并将文本字符串组成为压缩上下文文本。通过本申请,将大语言模型处理的上下文长文本进行压缩,解决现有技术中语义模型处理长上下文文本时需要消耗巨大的模型计算资源和数据存储资源的技术问题。
技术关键词
文本生成方法 大语言模型 标识符 解码模型 词嵌入向量 压缩单元 融合特征 样本 非暂态计算机可读存储介质 数据存储资源 文本生成装置 编码 处理器 模型压缩 多层感知机 计算机程序产品 参数
系统为您推荐了相关专利信息
1
微机联锁设备的通信方法、系统、装置、设备和存储介质
IO板卡 通信板 报文 通信方法 继电器
2
一种面向网络商品直播销售的实时监测系统
直播视频数据 实时监测系统 线索 统计语言模型 大语言模型
3
基于声学信号的风力发电机传动链故障识别方法及系统
风力发电机传动链 故障识别方法 风力发电机故障 声音采集器 声波
4
可视化界面构建方法、装置、设备及存储介质
生成可视化界面 生成业务 文档编辑工具 前端组件 代码编辑器
5
一种人员评价数据处理方法及系统
评价数据处理方法 贝叶斯网络模型 语义标签 图谱 标识符
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号