模型训练方法、查询方法、装置、服务器和存储介质

正文

推荐专利

申请号：CN202511070060

申请日期：2025-07-31

公开号：CN120950674A

公开日期：2025-11-14

类型：发明专利

摘要

本申请涉及一种模型训练方法、查询方法、装置、服务器和存储介质。所述大模型训练方法包括：基于样本查询问题，从文档库中检索与样本查询问题相关的辅助文档；将样本查询问题、辅助文档和样本候选文档输入至初始生成式模型中，得到样本查询问题的样本回复信息；样本回复信息为初始生成式模型基于样本查询问题和辅助文档，确定样本查询问题对应的用户意图信息，并基于用户意图信息和样本候选文档输出的；根据样本回复信息，得到目标奖励；基于目标奖励和强化学习算法对初始生成式模型进行训练，得到目标生成式模型。采用该模型训练方法能够提高生成式模型输出的推荐内容的准确度。

技术关键词

样本强化学习算法模型训练方法度量意图查询方法格式模型训练装置大语言模型服务器查询装置计算机程序产品处理器模块可读存储介质存储器参数

系统为您推荐了相关专利信息

基于交替迭代优化的深度确定性梯度策略计算卸载方法

交替迭代优化卸载方法终端设备卸载策略网络

基于光学传递函数解耦的合成孔径活塞误差探测方法

光学传递函数活塞望远镜误差校正技术掩膜

基于时频域协同特征对齐的无监督域自适应故障诊断方法

故障诊断方法特征提取模块分类器故障诊断模型共享卷积神经网络

问答任务处理模型训练方法、装置、设备及存储介质

模型训练算法模型训练方法数据正确率标识

一种基于多智能体协同的工业隐患排查决策方法

多智能体协同决策方法工业机器学习模型多模态

模型训练方法、查询方法、装置、服务器和存储介质

站点导航

APP 下载