语言模型训练方法、设备、存储介质及计算机程序产品

正文

推荐专利

申请号：CN202510017803

申请日期：2025-01-06

公开号：CN119830015A

公开日期：2025-04-15

类型：发明专利

摘要

本申请公开了一种语言模型训练方法、设备、存储介质及计算机程序产品，涉及自然语言处理技术领域，方法包括：第二设备训练小语言模型后，将小语言模型针对于文本数据的第二训练结果发送给第一设备；第一设备确定文本数据归属于对应的第二训练结果满足预设条件的第二设备，并发送第一发送指示信息给第二设备，第二设备发送第一发送指示信息中指示的文本数据的第二概率分布预测结果给第一设备，第一设备基于第二概率分布预测结果优化大语言模型，直到满足预设训练结束条件后，获得训练完成的大语言模型。本申请能在模型训练过程中对第一设备与第二设备之间传递的通信量进行优化。

技术关键词

语言模型训练方法大语言模型度量标签文本问答模型样本计算机程序产品数据模型训练设备设备通信处理器自然语言通信量可读存储介质存储器

系统为您推荐了相关专利信息

一种二进制程序堆漏洞可利用路径探索方法

序列模板漏洞路径探索方法验证目标程序内存

用于富视觉文档中非文本对象分析与理解的统一解决方法

大语言模型视觉文本对象多任务

一种地理建模案例知识图谱的构建方法、装置及存储介质

实体间关系 Neo4j数据库知识图谱构建装置大语言模型结构设计模块

一种面向变压器缺陷精准定位的大模型知识抽取方法及系统

变压器缺陷知识抽取方法三元组大语言模型微调方法

健康异常检测系统、方法和计算机可读取存储介质

记忆异常检测系统多模态体征数据异常检测方法动态更新

语言模型训练方法、设备、存储介质及计算机程序产品

站点导航

APP 下载