摘要
本公开提供了一种基于大语言模型的长文本处理方法、装置、设备和存储介质,涉及大语言模型等技术领域。该长文本处理方法包括:响应于目标查询请求,将长文本划分成多个文档片段;将第i+1个文档片段和第i个文档片段的局部特征表示输入经过微调的大语言模型的编码器,生成第i+1个文档片段的局部特征表示;根据所述第i+1个文档片段的局部特征表示对第i个全局特征表示进行更新,生成更新的全局特征表示;将查询语句和更新的全局特征表示输入所述大语言模型的解码器,生成目标查询结果。
技术关键词
大语言模型
文本处理方法
编码器
解码器
语句
变形器
文本处理装置
编辑
模块
微调方法
计算机程序产品
微调装置
数值
处理器通信
网络
指令
样本
系统为您推荐了相关专利信息
编码器
多头注意力机制
图像块
图像分类模型
图像分割
可见光图像
关键帧
惯性定位方法
滑动窗口
可见光相机
结构变形监测
数字孪生
轴磁传感器
增量编码器
激光雷达扫描仪