大语言模型的微调训练方法、电子设备、存储介质和程序产品

正文

推荐专利

申请号：CN202511059820

申请日期：2025-07-30

公开号：CN121009164A

公开日期：2025-11-25

类型：发明专利

摘要

本申请实施例提供一种大语言模型的微调训练方法、电子设备、存储介质和程序产品，涉及人工智能技术领域，该方法包括：获取针对同一个训练问题生成的多个独立的候选答案，基于多个候选答案的分布特征，量化表示训练问题的不确定程度，根据多个候选答案的不确定程度，对训练问题的损失权重赋值，其中，不确定程度越高，损失权重越高，获取多个训练问题的损失权重，并基于使用各训练问题的损失权重加权的损失函数，对大语言模型执行微调训练。本申请实施例基于训练问题的不确定性对损失权重赋不同的值，调节各训练问题的损失在损失函数中的重要程度，从而协同优化大语言模型微调训练过程的训练效率和推理精度。

技术关键词

大语言模型答案生成方式分布特征文本电子设备可读存储介质人工智能技术计算机程序产品聚类处理器教师存储器频率精度

系统为您推荐了相关专利信息

一种基于大模型的RAG出题与自动判题系统

存储模块智慧教育技术综合评估模型交叉验证方法资料

问答对生成方法、装置、电子设备及存储介质

问答对生成方法文本意图识别模型非暂态计算机可读存储介质实体识别技术

一种基于指令模式的起爆方法及系统

起爆方法文本识别模型指令波特率漏洞

一种图像处理方法、装置及设备

文本识别图像处理方法图像处理设备风险图像处理装置

基于大模型语义理解的商品特征自动提取方法及系统

商品特征语义基准聚类编码

大语言模型的微调训练方法、电子设备、存储介质和程序产品

站点导航

APP 下载