基于大语言模型的长文本记忆保持方法、系统、设备和存储介质

正文

推荐专利

申请号：CN202510481803

申请日期：2025-04-17

公开号：CN120429421A

公开日期：2025-08-05

类型：发明专利

摘要

本发明涉及一种基于大语言模型的长文本记忆保持方法、系统、设备和存储介质。所述方法包括：通过大语言模型中的分词器对长文本信息中的文本内容进行分级，得到各个文本内容的各个级别；基于注意力机制分别对各个级别的文本内容进行上下文信息权重计算，得到各个级别对应的权重；根据各个级别对应的权重将各个文本内容存储至短期记忆空间或长期记忆空间；使用KV Cache对短期记忆空间或长期记忆空间进行压缩处理，得到压缩后保留的文本内容并输出。通过对长文本信息中的文本内容进行分级，然后计算对应级别的权重，保证了多个维度的上下文内容的逻辑一致性；使用KV Cache对记忆空间进行压缩处理，可以加速大语言模型的推理时间。

技术关键词

大语言模型文本记忆注意力机制权重分配策略处理器网络结构计算机设备存储模块可读存储介质列表存储器矩阵令牌摘要分词分层逻辑

系统为您推荐了相关专利信息

缩略词识别方法及其装置、计算机设备及存储介质

词嵌入向量术语词嵌入模型识别方法计算机设备

一种基于暗光路侧泊车场景的视频语义分割方法及系统

视频语义分割方法泊车场景运动特征事件特征语义分割系统

一种基于多模态数据融合的智能安全预警方法、装置、设备及存储介质

多模态数据融合终端设备预警模型预警方法中心服务器

基于标识解析的动态因果知识图谱构建方法、系统及设备

知识图谱构建方法实体识别模型时序传感器节点文本

一种大模型驱动的机械部件的优化设计方法及系统

优化设计方法机械部件结构设计方案生成三维模型燃气轮机涡轮叶片

基于大语言模型的长文本记忆保持方法、系统、设备和存储介质

站点导航

APP 下载