摘要
本申请公开了一种模型训练方法及相关产品。该方法包括:在i台设备的运行内存中部署第一模型;在m台设备的运行内存中部署第二模型;在n台设备的显存中部署第一模型;利用n台设备中的第一模型,对训练提示词进行处理,生成第一文本;将n台设备的显存中的第一模型从显存转移至运行内存;将部署在i台设备的第一模型从运行内存转移至显存;将部署在m台设备的第二模型从运行内存转移至显存;利用m台设备的显存中的第二模型,对训练提示词和第一文本进行处理,预估第一文本中的目标词对目标匹配度的第一提升度;基于第一提升度确定第一模型的第一损失;基于第一损失,更新i台设备的显存中的第一模型的参数,得到目标模型。
技术关键词
共享存储空间
内存
文本
一台设备
模型训练方法
模型训练装置
计算机程序代码
共享设备
计算机程序产品
自然语言
可读存储介质
指令
处理器
参数
电子设备
数据存储
处理单元
存储器
系统为您推荐了相关专利信息
富文本格式
节点
协同编辑方法
空间结构关系
布局
问答机器人
文本
性能测试脚本
大语言模型
抗噪声
数据分类分级
异常数据
数据安全
分析方法
监控网络流量
文本生成模型
样本
语音识别方法
语音翻译方法
模型库