摘要
本申请提供大语言模型生成文本持续溯源模型训练方法及设备,涉及基于特定计算模型的计算机系统领域,方法包括:提取当前训练阶段的各个训练样本中的文本数据各自的特征向量,训练样本中还包含大语言模型所属类型的标签,当前训练阶段的大语言模型发布时间晚于历史训练阶段的模型发布时间,获取各个大语言模型的初始原型及文本特征相关性数据,对各个历史和当前训练阶段获取的初始原型进行全局及局部去相关处理,得到各个大语言模型各自的去相关原型以生成大语言模型生成文本持续溯源模型。本申请能够解决传统溯源方法因固定标签集导致的频繁重新训练的问题,能够有效提高模型训练效率并降低资源消耗,并能够提高溯源结果的可靠性及有效性。
技术关键词
大语言模型
文本
原型
模型训练方法
特征提取单元
阶段
数据
溯源方法
预训练语言模型
处理器
标签组
计算机系统
可读存储介质
存储器
矩阵
有效性
电子设备
参数
系统为您推荐了相关专利信息
语音识别置信度
文本
语音识别方法
列表
大语言模型
关键用户识别方法
社交网络图
节点
指标
图论算法