基于上下文位置编码和傅里叶变换的语言模型训练方法

AITNT
正文
推荐专利
基于上下文位置编码和傅里叶变换的语言模型训练方法
申请号:CN202510655312
申请日期:2025-05-21
公开号:CN120633604A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了基于上下文位置编码和傅里叶变换的语言模型训练方法,属于计算机自然语言处理技术领域,包括以下步骤:S1、预处理用户输入的文本数据;S2、将预处理后的文本信息进行上下文位置编码;S3、经上下文位置编码后,再对每个相对位置编码向量进行傅里叶变换;S4、经过傅里叶变换后的位置编码向量,进行模型预训练和指令微调,利用最小化损失函数,衡量预测结果与真实目标之间的差异;S5、最后完成模型张量分布式并行训练。本发明提高了模型训练过程中的准确率,且适用于长上下文场景,能够实现准确的文本生成。
技术关键词
语言模型训练方法 模型预训练 编码向量 计算机自然语言 文本 图形处理器 生成向量 查询特征 关系建模 语法结构 语义 指令 注意力机制 数据 连续型 矩阵 参数 标签
系统为您推荐了相关专利信息
1
应用于电力设计领域多路径问答系统的解决方案检索方法
问答系统 检索方法 多路径 大语言模型 命名实体识别模型
2
基于人工智能的子图生成方法、装置、计算机设备及介质
蚁群算法 生成方法 文本 计算机可读指令 遗传算法
3
待融资发票校验方法、装置、设备及介质
发票校验方法 大语言模型 表格 处理器 可读存储介质
4
一种基于聚类算法的消保热点数据分析系统及方法
关键词 文本 数据分析方法 聚类算法 标识
5
一种基于多层次提示学习的鼻窦图像自动识别与分割方法
视觉特征 分割方法 图像块 特征提取模型 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号