基于大语言模型的长文本记忆保持方法、系统、设备和存储介质

AITNT
正文
推荐专利
基于大语言模型的长文本记忆保持方法、系统、设备和存储介质
申请号:CN202510481803
申请日期:2025-04-17
公开号:CN120429421A
公开日期:2025-08-05
类型:发明专利
摘要
本发明涉及一种基于大语言模型的长文本记忆保持方法、系统、设备和存储介质。所述方法包括:通过大语言模型中的分词器对长文本信息中的文本内容进行分级,得到各个文本内容的各个级别;基于注意力机制分别对各个级别的文本内容进行上下文信息权重计算,得到各个级别对应的权重;根据各个级别对应的权重将各个文本内容存储至短期记忆空间或长期记忆空间;使用KV Cache对短期记忆空间或长期记忆空间进行压缩处理,得到压缩后保留的文本内容并输出。通过对长文本信息中的文本内容进行分级,然后计算对应级别的权重,保证了多个维度的上下文内容的逻辑一致性;使用KV Cache对记忆空间进行压缩处理,可以加速大语言模型的推理时间。
技术关键词
大语言模型 文本 记忆 注意力机制 权重分配策略 处理器 网络结构 计算机设备 存储模块 可读存储介质 列表 存储器 矩阵 令牌 摘要 分词 分层 逻辑
系统为您推荐了相关专利信息
1
缩略词识别方法及其装置、计算机设备及存储介质
词嵌入向量 术语 词嵌入模型 识别方法 计算机设备
2
一种基于暗光路侧泊车场景的视频语义分割方法及系统
视频语义分割方法 泊车场景 运动特征 事件特征 语义分割系统
3
一种基于多模态数据融合的智能安全预警方法、装置、设备及存储介质
多模态数据融合 终端设备 预警模型 预警方法 中心服务器
4
基于标识解析的动态因果知识图谱构建方法、系统及设备
知识图谱构建方法 实体识别模型 时序 传感器节点 文本
5
一种大模型驱动的机械部件的优化设计方法及系统
优化设计方法 机械部件 结构设计方案 生成三维模型 燃气轮机涡轮叶片
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号