一种语言模型训练方法、装置、存储介质和电子设备

正文

推荐专利

申请号：CN202411655853

申请日期：2024-11-19

公开号：CN119740024A

公开日期：2025-04-01

类型：发明专利

摘要

本发明提供了一种语言模型训练方法、装置、存储介质和电子设备，属于自然语言处理技术领域。本发明实施例首先基于基础数据集，对初始语言模型进行训练，得到第一语言模型；然后根据第一语言模型在同一提示词下生成的回答文本对的事实性得分，将事实性得分较高的回答文本标注为优选回答，将事实性得分较低的回答文本标注为非优选回答，以构建得到偏好数据集；最后基于偏好数据集和预设的事实性强化算法，对第一语言模型进行训练，得到目标语言模型。本发明实施例利用偏好数据集对第一语言模型进行进一步的事实性强化训练，使得训练得到的目标语言模型在生成内容时能够优先选择事实性更高的文本，进而显著提升模型生成内容的事实准确性。

技术关键词

语言模型训练方法文本数据样本算法模型训练装置参数电子设备网络基础自然语言处理器可读存储介质模块存储器计算机标签

系统为您推荐了相关专利信息

基于人工智能的自动化计算机控制方法及系统

自动化计算机控制方法设备运行状态频域特征提取控制策略预测阈值

基于合作博弈的多目标优化RRT*机器人路径规划方法

非线性扰动观测器机器人动力学模型状态空间方程跟踪控制算法离散状态空间

一种防冻型节能雾炮机

温度检测传感器雾炮机电加热丝保温套信号预处理模块

用于增材制造氧化物弥散强化钢的自适应调控方法、设备和系统

前馈神经网络成形神经网络模型氧化物弥散强化参数

掘进巷道的通风参数优化方法及粉尘浓度控制方法

掘进巷道参数优化方法回归算法粉尘浓度控制通风

一种语言模型训练方法、装置、存储介质和电子设备

站点导航

APP 下载