摘要
本说明书实施例提供一种利用多模态大模型处理多模态数据的方法,该多模态大模型中包括大语言模型,该大语言模型包括多个注意力头,多个注意力头对应于不同的掩码矩阵,该方法包括:利用多个注意力头中的目标注意力头对多个表征向量进行注意力处理,得到初始注意力矩阵,该多个表征向量包括,输入图像对应的若干图像表征,以及输入文本对应的若干文本表征。利用目标注意力头对应的目标掩码矩阵对初始注意力矩阵进行掩码处理,得到更新注意力矩阵,目标掩码矩阵在行号小于列号的若干目标位置具有有效值。
技术关键词
掩码矩阵
大语言模型
图像编码器
文本
多模态
有效值
适配器
注意力机制
基础
索引
答案
计算机
可读存储介质
处理单元
存储器
数据
处理器
系统为您推荐了相关专利信息
中文文本识别
辅助分类器
判别特征
Softmax函数
文本校正
建筑外墙面
缺陷检测方法
图片
多模态数据融合
形态学滤波
激光雷达点云
多模态
天气
二维卷积神经网络
Sigmoid函数
按键信号
对话机器人
交互方法
语音活动检测
自动语音识别