摘要
本说明书提供一种语言模型的训练方法、自然语言处理方法及装置。所述语言模型的训练方法包括:针对原始数据集中的每个目标问题,利用语言模型对目标问题进行多次推理,得到多个回答数据,在每次推理时语言模型的温度值不同;从多个回答数据中筛选出第一重复度大于第一阈值的第一回答数据和第二重复度小于第二阈值的第二回答数据;将目标问题、第一回答数据和第二回答数据作为偏好数据,添加至偏好数据集;利用偏好数据集训练语言模型。
技术关键词
数据
文本
序列
自然语言
子模块
训练装置
训练语言模型
分词
处理器
输入模块
存储器
程序
参数
系统为您推荐了相关专利信息
婴幼儿睡眠
婴幼儿头部
实时图像
识别婴幼儿
识别方法
深度网络模型
稠密点云
协方差矩阵
三维场景重建技术
数据
信息推荐模型
节点特征
序列
信息推送方法
数据获取模块
敏感信息识别
权限控制方法
可视化界面
审计日志
大语言模型
音视频
智能校园
数据包头
关键词
计算机程序代码