基于多模态大模型的数据处理方法及装置

正文

推荐专利

基于多模态大模型的数据处理方法及装置

申请号：CN202411075300

申请日期：2024-08-07

公开号：CN118606684B

公开日期：2024-11-19

类型：发明专利

摘要

本申请提供一种基于多模态大模型的数据处理方法及装置，涉及数据处理，包括：获取多模态数据，从多模态数据中提取图像数据和文本数据，利用ViT模型对图像数据进行特征提取以及残差矢量量化，获取与经过序列化编码后的第一文本数据相统一的第二图像数据，再将第二图像数据和第一文本数据进行拼接，利用大型语言模型进行自回归预测，获取下一个特征数据，然后，从下一个特征数据中提取第一图像特征数据，对第一图像特征数据进行视觉特征重构，再将视觉特征重构数据解码到像素空间，获取填充像素细节后的第二图像特征数据，在解决了多模态数据在图像数据和文本数据上表示不一致的问题的同时，确保了最终预测的第二图像特征数据的完整性。

技术关键词

图像特征数据数据处理方法视觉特征多模态文本矢量量化数据解码像素图像块特征解码器数据处理装置重构模块编码解码模块字典

系统为您推荐了相关专利信息

一种面向中文短文本的半监督地名数据标注方法

数据标注方法面向中文语义文本地点

多模态生物电信号防串扰采集电路、芯片及可穿戴设备

隔离模块生物电信号传感器电源模块发射器接收器

基于水凝胶的器官芯片微流控制方法及装置

微流控制方法器官芯片水凝胶流体动力学参数动态算法

知识问答方法、装置、计算机设备及存储介质

知识问答方法文本语句答案分词

图像生成方法、系统、存储介质及电子设备

图像生成方法图像生成模型生成对抗网络随机噪声图像生成系统

基于多模态大模型的数据处理方法及装置

站点导航

APP 下载