摘要
本申请公开了一种模型训练方法、装置、设备及存储介质,涉及计算机技术领域。上述方法包括:获取语言模型的训练样本,该训练样本包括样本提示词和针对样本提示词的第一回应文本;将样本提示词输入语言模型,语言模型用于基于样本提示词生成预测回应文本;在语言模型生成预测回应文本中的第i个分词之后,基于已生成序列,确定停止触发函数值;基于第一回应文本和停止触发函数值,训练语言模型。上述方法能够使得语言模型学习到在逐个生成分词的过程中,停止分词生成的合理时机,进而保障语言模型输出的文本具有较为合理的结束位置。
技术关键词
文本
分词
序列
模型训练方法
样本
关系
可读存储介质
计算机程序产品
训练语言模型
模型训练装置
计算机设备
处理器
输入模块
存储器
参数
系统为您推荐了相关专利信息
嵌入特征
智能问答方法
智能回答方法
排序模型
摘要
时间序列特征
空间测绘技术
节点运行状态
整合电力系统
生成网络拓扑
局部放电智能
故障诊断模型
诊断方法
时域特征
时序
OTA升级包
数据
分词训练
通信接口
上下文特征
测量方法
噪声数据
特征值
图像
训练深度学习模型