基于多模态大模型的数据处理方法及装置

AITNT
正文
推荐专利
基于多模态大模型的数据处理方法及装置
申请号:CN202411075300
申请日期:2024-08-07
公开号:CN118606684B
公开日期:2024-11-19
类型:发明专利
摘要
本申请提供一种基于多模态大模型的数据处理方法及装置,涉及数据处理,包括:获取多模态数据,从多模态数据中提取图像数据和文本数据,利用ViT模型对图像数据进行特征提取以及残差矢量量化,获取与经过序列化编码后的第一文本数据相统一的第二图像数据,再将第二图像数据和第一文本数据进行拼接,利用大型语言模型进行自回归预测,获取下一个特征数据,然后,从下一个特征数据中提取第一图像特征数据,对第一图像特征数据进行视觉特征重构,再将视觉特征重构数据解码到像素空间,获取填充像素细节后的第二图像特征数据,在解决了多模态数据在图像数据和文本数据上表示不一致的问题的同时,确保了最终预测的第二图像特征数据的完整性。
技术关键词
图像特征数据 数据处理方法 视觉特征 多模态 文本 矢量量化 数据解码 像素 图像块特征 解码器 数据处理装置 重构模块 编码 解码模块 字典
系统为您推荐了相关专利信息
1
一种面向中文短文本的半监督地名数据标注方法
数据标注方法 面向中文 语义 文本 地点
2
多模态生物电信号防串扰采集电路、芯片及可穿戴设备
隔离模块 生物电信号传感器 电源模块 发射器 接收器
3
基于水凝胶的器官芯片微流控制方法及装置
微流控制方法 器官芯片 水凝胶 流体动力学参数 动态算法
4
知识问答方法、装置、计算机设备及存储介质
知识问答方法 文本 语句 答案 分词
5
图像生成方法、系统、存储介质及电子设备
图像生成方法 图像生成模型 生成对抗网络 随机噪声 图像生成系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号