基于上下文位置编码和傅里叶变换的语言模型训练方法

正文

推荐专利

申请号：CN202510655312

申请日期：2025-05-21

公开号：CN120633604A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了基于上下文位置编码和傅里叶变换的语言模型训练方法，属于计算机自然语言处理技术领域，包括以下步骤：S1、预处理用户输入的文本数据；S2、将预处理后的文本信息进行上下文位置编码；S3、经上下文位置编码后，再对每个相对位置编码向量进行傅里叶变换；S4、经过傅里叶变换后的位置编码向量，进行模型预训练和指令微调，利用最小化损失函数，衡量预测结果与真实目标之间的差异；S5、最后完成模型张量分布式并行训练。本发明提高了模型训练过程中的准确率，且适用于长上下文场景，能够实现准确的文本生成。

技术关键词

语言模型训练方法模型预训练编码向量计算机自然语言文本图形处理器生成向量查询特征关系建模语法结构语义指令注意力机制数据连续型矩阵参数标签

系统为您推荐了相关专利信息

应用于电力设计领域多路径问答系统的解决方案检索方法

问答系统检索方法多路径大语言模型命名实体识别模型

基于人工智能的子图生成方法、装置、计算机设备及介质

蚁群算法生成方法文本计算机可读指令遗传算法

待融资发票校验方法、装置、设备及介质

发票校验方法大语言模型表格处理器可读存储介质

一种基于聚类算法的消保热点数据分析系统及方法

关键词文本数据分析方法聚类算法标识

一种基于多层次提示学习的鼻窦图像自动识别与分割方法

视觉特征分割方法图像块特征提取模型对象

基于上下文位置编码和傅里叶变换的语言模型训练方法

站点导航

APP 下载