模型训练方法、模型推理方法、装置及电子设备

正文

推荐专利

申请号：CN202410852340

申请日期：2024-06-27

公开号：CN118780334A

公开日期：2024-10-15

类型：发明专利

摘要

本发明提供一种模型训练方法、模型推理方法、装置及电子设备，模型训练方法包括：利用单向主干模型的第一预测头模块对多模态输入信息的隐空间词元序列中隐空间词元分段进行下一个词元预测，得到第一词元预测结果；基于隐空间词元分段，利用单向主干模型的第二预测头模块在隐空间词元序列内进行固定位置词元预测和随机位置词元预测，得到第二词元预测结果；基于第一词元预测结果和第二词元预测结果，确定多模态输入信息对应的掩码隐空间词元序列，并将掩码隐空间词元序列确定为模型训练结果。本发明提高了每步词元预测效率，结合不同预测头进行不同方式词元预测还能够提升最终词元生成效果，大幅提高了单向主干模型的模型训练效率和模型训练结果的精度。

技术关键词

模型训练方法序列推理方法多模态模块分段非暂态计算机可读存储介质模型训练装置电子设备推理装置处理器存储器程序精度

系统为您推荐了相关专利信息

一种变电设备用故障检测装置及使用方法

故障检测装置算法模块红外检测器故障检测模块故障智能诊断

一种宠物训练装置

MCU芯片耦合电感信号发送电路宠物训练装置信号接收电路

智能家居的联动控制方法、装置、设备及计算机可读介质

智能家居设备联动控制方法场景大语言模型声学特征

一种基于虚拟电厂的多维度车网调度优化方法及系统

调度优化方法电量预测模型风力发电数据光伏发电数据发电量

一种区域范围内微爆破监测系统及方法

爆破监测系统数据分析模块三维激光扫描仪双线性插值算法监测方法

模型训练方法、模型推理方法、装置及电子设备

站点导航

APP 下载