利用多模态大模型处理多模态数据的方法及装置

AITNT
正文
推荐专利
利用多模态大模型处理多模态数据的方法及装置
申请号:CN202510225325
申请日期:2025-02-26
公开号:CN120068940A
公开日期:2025-05-30
类型:发明专利
摘要
本说明书实施例提供一种利用多模态大模型处理多模态数据的方法,该多模态大模型中包括大语言模型,该大语言模型包括多个注意力头,多个注意力头对应于不同的掩码矩阵,该方法包括:利用多个注意力头中的目标注意力头对多个表征向量进行注意力处理,得到初始注意力矩阵,该多个表征向量包括,输入图像对应的若干图像表征,以及输入文本对应的若干文本表征。利用目标注意力头对应的目标掩码矩阵对初始注意力矩阵进行掩码处理,得到更新注意力矩阵,目标掩码矩阵在行号小于列号的若干目标位置具有有效值。
技术关键词
掩码矩阵 大语言模型 图像编码器 文本 多模态 有效值 适配器 注意力机制 基础 索引 答案 计算机 可读存储介质 处理单元 存储器 数据 处理器
系统为您推荐了相关专利信息
1
一种基于判别性特征的手写中文文本识别方法
中文文本识别 辅助分类器 判别特征 Softmax函数 文本校正
2
一种可见光与红外图像融合的建筑外墙面缺陷检测方法
建筑外墙面 缺陷检测方法 图片 多模态数据融合 形态学滤波
3
一种文本事件关系提取方法、装置
文本 样本 关系提取方法 数据 事件识别
4
一种基于多模态融合的天气自适应三维目标检测方法
激光雷达点云 多模态 天气 二维卷积神经网络 Sigmoid函数
5
对话机器人交互方法、系统、介质、产品及终端
按键信号 对话机器人 交互方法 语音活动检测 自动语音识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号