大语言模型生成文本持续溯源模型训练方法及设备

正文

推荐专利

申请号：CN202510646849

申请日期：2025-05-20

公开号：CN120179812B

公开日期：2025-10-10

类型：发明专利

摘要

本申请提供大语言模型生成文本持续溯源模型训练方法及设备，涉及基于特定计算模型的计算机系统领域，方法包括：提取当前训练阶段的各个训练样本中的文本数据各自的特征向量，训练样本中还包含大语言模型所属类型的标签，当前训练阶段的大语言模型发布时间晚于历史训练阶段的模型发布时间，获取各个大语言模型的初始原型及文本特征相关性数据，对各个历史和当前训练阶段获取的初始原型进行全局及局部去相关处理，得到各个大语言模型各自的去相关原型以生成大语言模型生成文本持续溯源模型。本申请能够解决传统溯源方法因固定标签集导致的频繁重新训练的问题，能够有效提高模型训练效率并降低资源消耗，并能够提高溯源结果的可靠性及有效性。

技术关键词

大语言模型文本原型模型训练方法特征提取单元阶段数据溯源方法预训练语言模型处理器标签组计算机系统可读存储介质存储器矩阵有效性电子设备参数

系统为您推荐了相关专利信息

语音识别方法及存储介质

语音识别置信度文本语音识别方法列表大语言模型

一种社交网络中的关键用户识别方法及系统

关键用户识别方法社交网络图节点指标图论算法

一种基于互信息和跨模态文本增强的多模态情感分析方法和装置

情感分析方法文本注意力跨模态情感分析模型

文本生成序列长度预测模型及其训练方法

网络结构大语言模型序列文本开源社区

一种垂直领域大模型的微调方法、装置及介质

三元组微调方法字段大语言模型图谱

大语言模型生成文本持续溯源模型训练方法及设备

站点导航

APP 下载