摘要
本发明涉及大语言模型算法技术领域,揭露了一种基于上下文记忆嵌入的文本生成方法和系统,该方法包括:利用预设的大语言模型对上下文文本进行文本记忆压缩,得到文本压缩特征;利用所述大语言模型对所述文本压缩特征进行特征嵌入转换,得到记忆嵌入特征;根据所述记忆嵌入特征对所述大语言模型进行双任务预训练,得到预训练大语言模型;利用所述预训练大语言模型对预设的目标文本进行推理解码,得到解码文本。通过本发明实施例的压缩器、转换器以及推理解码结构,可以提高大语言模型的文本推理效率。
技术关键词
大语言模型
文本生成方法
压缩特征
嵌入特征
记忆
分段
编码
语义
文本生成系统
矩阵
词特征
序列
算法技术
解码结构
注意力机制
解码模块
压缩器
系统为您推荐了相关专利信息
自动化测试方法
大语言模型
文本
计算机可读指令
数据
融合图像特征
图像翻译方法
视觉特征
语义特征
翻译模型