语言模型的训练方法、自然语言处理方法及装置

正文

推荐专利

申请号：CN202411389707

申请日期：2024-09-30

公开号：CN119227809A

公开日期：2024-12-31

类型：发明专利

摘要

本说明书提供一种语言模型的训练方法、自然语言处理方法及装置。所述语言模型的训练方法包括：针对原始数据集中的每个目标问题，利用语言模型对目标问题进行多次推理，得到多个回答数据，在每次推理时语言模型的温度值不同；从多个回答数据中筛选出第一重复度大于第一阈值的第一回答数据和第二重复度小于第二阈值的第二回答数据；将目标问题、第一回答数据和第二回答数据作为偏好数据，添加至偏好数据集；利用偏好数据集训练语言模型。

技术关键词

数据文本序列自然语言子模块训练装置训练语言模型分词处理器输入模块存储器程序参数

系统为您推荐了相关专利信息

婴幼儿躯体被遮挡下翻身识别方法、装置、设备及介质

婴幼儿睡眠婴幼儿头部实时图像识别婴幼儿识别方法

一种可泛化的即插即用3D高斯泼溅模块的设计方法

深度网络模型稠密点云协方差矩阵三维场景重建技术数据

信息推送方法、装置、设备、介质和程序产品

信息推荐模型节点特征序列信息推送方法数据获取模块

一种基于大模型的敏感信息识别和权限控制方法

敏感信息识别权限控制方法可视化界面审计日志大语言模型

一种智能校园音视频求助处理方法

音视频智能校园数据包头关键词计算机程序代码

语言模型的训练方法、自然语言处理方法及装置

站点导航

APP 下载