模型训练方法、模型推理方法、电子设备及存储介质

正文

推荐专利

申请号：CN202410912446

申请日期：2024-07-08

公开号：CN118586525B

公开日期：2025-05-13

类型：发明专利

摘要

本发明提供一种模型训练方法、模型推理方法、电子设备及存储介质，其中模型训练方法，包括：基于视觉模态和语言模态各自的词元分段，确定待单向解码训练的第一词元分段以及待双向解码训练的第二词元分段；基于第一词元分段和第二词元分段以及各自携带的模态标识，对初始的统一多模态大模型进行混合单向和双向并行解码的训练；直至确定训练结果满足预设训练停止条件时对应的目标统一多模态大模型。本发明不仅提高了每个模态词元分段的训练效率，也提高了每个模态词元分段经解码训练后所得预测词元的词元生成效果，从而在保持模型对不同模态词元预测效果的同时，也能提高统一多模态大模型的推理效率。

技术关键词

模型训练方法多模态解码推理方法分段非暂态计算机可读存储介质视觉电子设备标识处理器注意力机制存储器序列关系程序

系统为您推荐了相关专利信息

一种模型训练方法、装置、存储介质及设备

训练样本数据节点模型训练方法业务执行装置业务执行方法

一种电力系统节点归因与推理方法、系统、设备及介质

电力系统推理方法卷积神经网络特征提取贝叶斯结构学习归因

基于自适应篡改痕迹学习的深度图像修复篡改检测方法

深度图像修复篡改检测方法神经网络结构搜索卷积模块网络模块

基于Transformer架构的情绪检测模型训练方法、系统及存储介质

检测模型训练方法情绪检测系统超参数数据 BERT模型

一种基于深度卷积神经网络的发动机静子件小目标裂纹长度测量方法

深度卷积神经网络长度测量方法语义分割网络图像发动机

模型训练方法、模型推理方法、电子设备及存储介质

站点导航

APP 下载