摘要
本发明提供一种大语言模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。其中,大语言模型的训练方法,包括:获取指令响应数据对;其中,指令响应数据对由指令和利用大语言模型根据指令生成的响应组成,响应包括预设领域的文本;从指令响应数据对包含的响应中,提取响应包含的约束信息;根据响应、响应包含的约束信息以及响应对应的指令,生成训练数据集;利用训练数据集,对预训练的大语言模型进行继续训练,得到目标大语言模型,以利用目标大语言模型根据指令,生成响应。本发明可以高效地训练得到可准确执行具有复杂约束的指令的大语言模型,进而有效提升计算资源的利用率。
技术关键词
大语言模型
指令
样本
生成训练数据
标签
非暂态计算机可读存储介质
生成提示词
电子设备
处理器
人工智能技术
计算机程序产品
文本
训练装置
脚本
模块
存储器
模板
系统为您推荐了相关专利信息
血压计校准方法
校准血压计
支持向量机回归网络
非线性
记录环境参数
数据收集单元
随机森林模型
录井解释技术
智能模型
异常数据处理
异常检测系统
心脏
冲击特征
异常检测方法
信号预处理模块