一种大语言模型训练方法、装置、设备以及存储介质

正文

推荐专利

申请号：CN202510466477

申请日期：2025-04-14

公开号：CN120338019A

公开日期：2025-07-18

类型：发明专利

摘要

本申请公开一种大语言模型训练方法、装置、设备以及存储介质，涉及人工智能技术领域，该方法包括：将查询语句输入到大语言模型中得到大语言模型生成的回复语句；基于回复语句，确定第一损失值和第二损失值；其中，第一损失值用于衡量回复语句的安全程度；第二损失值用于衡量回复语句的词汇丰富程度；基于第一损失值和第二损失值，更新大语言模型的模型参数。该方法通过依据第一损失值和第二损失值更新大语言模型的模型参数，能够实现大语言模型在回复语句在安全性和丰富性上的平衡，在确保模型回复语句安全性的前提下，提升模型回复语句的词汇丰富性。

技术关键词

大语言模型语句信息熵电子设备序列频率可读存储介质人工智能技术指令计算机程序产品参数注意力机制训练装置处理器模块存储器软件线性

一种大语言模型训练方法、装置、设备以及存储介质

站点导航

APP 下载