多模态数据的处理方法、装置、设备和存储介质

正文

推荐专利

申请号：CN202411915913

申请日期：2024-12-24

公开号：CN119939211A

公开日期：2025-05-06

类型：发明专利

摘要

本申请实施例提供了一种多模态数据的处理方法、装置、设备和存储介质，获取多模态数据和多模态数据对应的处理指令；确定多模态数据对应的数据标签；根据多模态数据对应的数据标签，确定多模态数据对应的数据模态；数据模态包括视频模态、图像模态和文本模态；将多模态数据对应的数据模态从视频模态和图像模态统一为文本模态，得到多模态数据对应的文本特征；根据多模态数据对应的文本特征和处理指令，得到多模态数据对应的处理结果。通过将视频模态和图像模态统一转换为文本模态，实现了不同模态数据的统一表示，减少了模态之间的异构性带来的复杂性，可以减少模型处理高分辨率图像和长视频时的计算量，从而提高了计算效率。

技术关键词

多模态文本数据标签指令推理大语言模型视频图像数据分割机器可读介质分辨率数据处理模块处理器电子设备异构存储器

系统为您推荐了相关专利信息

基于WiFi和蓝牙双协议的灯具AI语音控制系统

灯光控制 AI语音语音信号处理技术分析模块日期

事件类型的确定方法、装置、程序产品以及电子设备

时间段数据神经网络模型注意力机制事件分类技术

基于隐变量的多视图聚类方法、装置、设备和存储介质

变量样本重构数据聚类方法

基于阵列成像的桥梁水下病害检测系统及方法

声呐偏振相机变螺距螺旋多模态模态特征

问答系统及其方法、装置、电子设备和存储介质

文本问答系统图像问答方法模块

多模态数据的处理方法、装置、设备和存储介质

站点导航

APP 下载