模型训练及信息答复方法、设备、存储介质及程序产品

AITNT
正文
推荐专利
模型训练及信息答复方法、设备、存储介质及程序产品
申请号:CN202511194085
申请日期:2025-08-25
公开号:CN120725157B
公开日期:2025-11-25
类型:发明专利
摘要
本申请提供了一种模型训练及信息答复方法、设备、存储介质及程序产品,涉及计算机技术领域。该方法包括:基于第一训练样本对基座模型进行持续预训练,得到基础模型;基于第二训练样本对基础模型进行冷启动监督微调训练,得到第一监督微调模型;基于第三训练样本、目标信息和待训练模型进行多次推理,得到推理结果;在第M次推理的过程中,目标信息包括前M‑1次推理确定的目标工具在调用后获取到的信息;基于推理结果对待训练模型进行优化,得到第一强化学习模型;基于通识数据以及第一强化学习模型输出的推理数据进行通识对齐训练,得到目标模型。该方法可以调用目标工具获取所需的目标信息,使得大模型输出的信息更加全面。
技术关键词
强化学习模型 信息答复方法 模型训练方法 数据 可执行程序代码 搜索工具 基础 电子设备 样本 电商 可读存储介质 计算机程序产品 答案 指令 基座 存储器 客户端 图片
系统为您推荐了相关专利信息
1
AI语音导购与云值守结合的无人零售交互方法及系统
商品推荐列表 AI语音 交互方法 融合神经网络 分层强化学习
2
基于异构图注意力网络的配电网短路故障诊断方法、设备和介质
故障类别 注意力 异构 故障定位模型 拓扑图
3
一种基于时序大模型的油气计量设备异常预警方法、系统、设备及介质
数据预测模型 油气 解码输入数据 预警方法 序列
4
基于数据分析的工单处理方法、装置、设备及存储介质
结构化数据模型 剪贴板内容 监听器 关键词 模型库
5
一种基于图像数据分析的投篮辅助训练方法及系统
辅助训练方法 投篮动作 速度 心率 三维模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号