摘要
本申请公开了多模态模型的训练方法、文本生成方法及装置,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。具体实现方案为:对第一多模态模型中的第一视觉编码器进行训练,得到经训练的第一视觉编码器;其中,第一多模态模型中的第一大语言模型的模型参数数量小于预设阈值;对第二大语言模型和经训练的第一视觉编码器进行训练,得到目标多模态模型;其中,第二大语言模型包括在第二多模态模型中。
技术关键词
大语言模型
图像特征向量
多模态
样本
文本生成方法
图文
文本生成装置
注意力
序列
参数
人工智能技术
计算机程序产品
计算机视觉
训练装置
处理器通信
分块
系统为您推荐了相关专利信息
栅格地图
行人检测
视觉
数据采集装置
多层级特征
图像生成模型
语义
样本
特征提取模型
图像生成方法
发票
字段
深度强化学习
高维特征向量
图像特征向量