多模态模型的训练方法、文本生成方法及装置

正文

推荐专利

申请号：CN202510706389

申请日期：2025-05-28

公开号：CN120807672A

公开日期：2025-10-17

类型：发明专利

摘要

本申请公开了多模态模型的训练方法、文本生成方法及装置，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于AIGC基于人工智能的内容生成等场景。具体实现方案为：对第一多模态模型中的第一视觉编码器进行训练，得到经训练的第一视觉编码器；其中，第一多模态模型中的第一大语言模型的模型参数数量小于预设阈值；对第二大语言模型和经训练的第一视觉编码器进行训练，得到目标多模态模型；其中，第二大语言模型包括在第二多模态模型中。

技术关键词

大语言模型图像特征向量多模态样本文本生成方法图文文本生成装置注意力序列参数人工智能技术计算机程序产品计算机视觉训练装置处理器通信分块

系统为您推荐了相关专利信息

标准体系模型的构建系统

构建系统目录分析单元节点采集单元

空地自适应融合感知方法

栅格地图行人检测视觉数据采集装置多层级特征

图像生成方法以及训练图像生成模型的方法

图像生成模型语义样本特征提取模型图像生成方法

基于深度强化学习的财务机器人发票识别与匹配方法

发票字段深度强化学习高维特征向量图像特征向量

一种电动滚筒控制方法及控制系统

作业行程滑动时间窗口决策参数时间段

多模态模型的训练方法、文本生成方法及装置

站点导航

APP 下载