摘要
本发明公开了基于上下文位置编码和傅里叶变换的语言模型训练方法,属于计算机自然语言处理技术领域,包括以下步骤:S1、预处理用户输入的文本数据;S2、将预处理后的文本信息进行上下文位置编码;S3、经上下文位置编码后,再对每个相对位置编码向量进行傅里叶变换;S4、经过傅里叶变换后的位置编码向量,进行模型预训练和指令微调,利用最小化损失函数,衡量预测结果与真实目标之间的差异;S5、最后完成模型张量分布式并行训练。本发明提高了模型训练过程中的准确率,且适用于长上下文场景,能够实现准确的文本生成。
技术关键词
语言模型训练方法
模型预训练
编码向量
计算机自然语言
文本
图形处理器
生成向量
查询特征
关系建模
语法结构
语义
指令
注意力机制
数据
连续型
矩阵
参数
标签
系统为您推荐了相关专利信息
问答系统
检索方法
多路径
大语言模型
命名实体识别模型
蚁群算法
生成方法
文本
计算机可读指令
遗传算法
发票校验方法
大语言模型
表格
处理器
可读存储介质