大语言模型的训练方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510786174

申请日期：2025-06-11

公开号：CN120670850A

公开日期：2025-09-19

类型：发明专利

摘要

本申请实施例提供了一种大语言模型的训练方法、装置、电子设备及存储介质，可涉及人工智能领域，该方法包括：获取提示词和多个样本问题，针对每个样本问题，将该样本问题和提示词输入到大语言模型中，通过执行多次答复生成操作得到该样本问题的多个答复，基于该样本问题的多个答复的语义相似性，聚类得到多个答复簇，根据每一答复簇中答复的数量，确定该答复簇中各答复对应的奖励，根据该样本问题的各答复对应的奖励，确定该样本问题对应的第一奖励，根据各样本问题对应的第一奖励，对大语言模型的模型参数进行调整，通过迭代训练得到训练后的大语言模型。该方法在无监督环境下实现了模型推理能力的有效提升，显著增强了模型的灵活性和实用性。

技术关键词

样本大语言模型分词计算机程序产品参数电子设备信息熵基准聚类处理器语义训练装置关系可读存储介质存储器模块

系统为您推荐了相关专利信息

基于塑性层调控的微动疲劳性能优化方法

性能优化方法微动疲劳寿命激光接触区关系

建筑物的移动闭合装置控制方法、系统、设备和存储介质

闭合装置控制传感器阵列建筑物去噪算法信号

一种WiFi射频自动化检测系统

自动化检测系统机械臂单元自动化控制模块信号采集模块干扰信号发生器

基于高光谱图像的稻种活力检测方法及系统

活力检测方法量子态箱子局部特征提取特征值

基于三维模型焊接参数子程序自动调用方法

焊接机器人焊接工艺参数自动调用方法三维模型自动调用系统

大语言模型的训练方法、装置、电子设备及存储介质

站点导航

APP 下载