基于多模态大模型的视频处理方法、装置、设备及介质

正文

推荐专利

申请号：CN202410881385

申请日期：2024-07-02

公开号：CN118779491A

公开日期：2024-10-15

类型：发明专利

摘要

本申请涉及数据处理技术领域，尤其涉及基于多模态大模型的视频处理方法、装置、设备及介质，在本申请实施例中，多模态大模型包括融合结构、语言大模型和至少两个视频编码器，其中，采用至少两个视频编码器提取目标视频的初始视频特征，并采用融合结构将多个视频编码器的初始视频特征进行融合，得到目标视频特征，实现视频的特征的精细化提取，增强多模态大模型视频细节描述能力。

技术关键词

视频编码器矩阵多模态文本样本参数数据处理技术注意力电子设备编码模块处理器可读存储介质存储器指令计算机数值

系统为您推荐了相关专利信息

基于多模态体表标志追踪的手术导航影像实时配准方法及系统

三维模型实时配准方法标志纹理特征图样

一种共享芯片系统内存的矩阵加速器及其运行方法

数据存取模块 SRAM读写控制加速器芯片系统子模块

一种基于大数据分析的医疗诊断方法及系统

医疗诊断方法病变特征大数据分析模型纹理特征灰度共生矩阵

一种联合比幅与变步长MUSIC的单极子交叉环天线信号测向方法

单极子交叉环天线 MUSIC算法测向方法噪声子空间信号

基于深度可分离卷积密集连接网络的异物入侵识别方法

入侵识别方法分布式声波传感数据分布二维声场光纤传感器

基于多模态大模型的视频处理方法、装置、设备及介质

站点导航

APP 下载