摘要
本申请涉及一种大语言模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取原始回答文本数据;去除原始回答文本数据中的第一回答文本数据,得到第二回答文本数据;第一回答文本数据为包括目标语言单元的回答文本;目标语言单元为用于表达拒绝回答语义的语言单元;去除第二回答文本数据中的第三回答文本数据,得到第四回答文本数据;第三回答文本数据为通过预训练的第一大语言模型识别出的含有拒绝回答意图的回答文本;采用包含有第四回答文本数据的训练样本数据对待训练的第二大语言模型训练,得到目标大语言模型。采用本方法能够解决大语言模型在面对用户的提问时输出的回答文本具有局限性的问题。
技术关键词
大语言模型
数据生成模型
文本
训练样本数据
计算机设备
意图
计算机程序产品
处理器
语义
训练装置
可读存储介质
规模
指令
模块
存储器
参数
场景
系统为您推荐了相关专利信息
序列标注模型
建模方法
条件随机场
数据
建模系统
验证规则
业务系统
策略
执行访问控制
计算机可读指令
影像分类方法
医学影像数据
小波多尺度
眼科
特征提取器