大语言模型长文本外推方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
大语言模型长文本外推方法、装置、电子设备及存储介质
申请号:CN202510055799
申请日期:2025-01-14
公开号:CN120012924A
公开日期:2025-05-16
类型:发明专利
摘要
本发明提供一种大语言模型长文本外推方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,获取预设长度的待处理文本;若预设长度大于初始大语言模型的训练文本的序列长度,则基于预设长度以及初始大语言模型的滑动窗口注意力机制的初始窗口尺寸,对滑动窗口注意力机制的初始位置编码进行扩展,并对初始窗口尺寸进行扩展,得到目标大语言模型;最后基于目标大语言模型,对待处理文本进行处理。通过对滑动窗口注意力机制的初始窗口尺寸和初始位置编码同步扩展,使目标大语言模型具备处理更长文本的能力。进而,通过目标大语言模型对待处理文本进行处理,可以保证处理效果,降低推理成本,且处理效果不受待处理文本的预设长度的限制。
技术关键词
大语言模型 外推方法 注意力机制 文本 滑动窗口 编码 尺寸 非暂态计算机可读存储介质 解码 电子设备 处理器 扩展模块 序列 自然语言 参数 存储器 阶段 分段
系统为您推荐了相关专利信息
1
基于大语言模型的政务热线服务知识图谱构建方法及系统
大语言模型 知识图谱构建方法 政务 实体语义关系 关联分析方法
2
一种图像处理方法及装置
图像处理方法 颅骨 磁共振 处理单元 切片
3
一种基于知识图谱的心血管疾病诊断系统
心血管疾病诊断 大语言模型 医学命名实体 节点 自然语言
4
基于神经网络的电磁信号图像数据处理方法
信号数据处理方法 装配部件 装配机器人 编码特征 编码模块
5
智能陪练调整系统及方法
负荷 队列 TOPSIS算法 听力 知识点标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号