模型训练及信息答复方法、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202511194085

申请日期：2025-08-25

公开号：CN120725157B

公开日期：2025-11-25

类型：发明专利

摘要

本申请提供了一种模型训练及信息答复方法、设备、存储介质及程序产品，涉及计算机技术领域。该方法包括：基于第一训练样本对基座模型进行持续预训练，得到基础模型；基于第二训练样本对基础模型进行冷启动监督微调训练，得到第一监督微调模型；基于第三训练样本、目标信息和待训练模型进行多次推理，得到推理结果；在第M次推理的过程中，目标信息包括前M‑1次推理确定的目标工具在调用后获取到的信息；基于推理结果对待训练模型进行优化，得到第一强化学习模型；基于通识数据以及第一强化学习模型输出的推理数据进行通识对齐训练，得到目标模型。该方法可以调用目标工具获取所需的目标信息，使得大模型输出的信息更加全面。

技术关键词

强化学习模型信息答复方法模型训练方法数据可执行程序代码搜索工具基础电子设备样本电商可读存储介质计算机程序产品答案指令基座存储器客户端图片

系统为您推荐了相关专利信息

AI语音导购与云值守结合的无人零售交互方法及系统

商品推荐列表 AI语音交互方法融合神经网络分层强化学习

基于异构图注意力网络的配电网短路故障诊断方法、设备和介质

故障类别注意力异构故障定位模型拓扑图

一种基于时序大模型的油气计量设备异常预警方法、系统、设备及介质

数据预测模型油气解码输入数据预警方法序列

基于数据分析的工单处理方法、装置、设备及存储介质

结构化数据模型剪贴板内容监听器关键词模型库

一种基于图像数据分析的投篮辅助训练方法及系统

辅助训练方法投篮动作速度心率三维模型

模型训练及信息答复方法、设备、存储介质及程序产品

站点导航

APP 下载