摘要
本申请涉及数据处理技术领域,尤其涉及基于多模态大模型的视频处理方法、装置、设备及介质,在本申请实施例中,多模态大模型包括融合结构、语言大模型和至少两个视频编码器,其中,采用至少两个视频编码器提取目标视频的初始视频特征,并采用融合结构将多个视频编码器的初始视频特征进行融合,得到目标视频特征,实现视频的特征的精细化提取,增强多模态大模型视频细节描述能力。
技术关键词
视频编码器
矩阵
多模态
文本
样本
参数
数据处理技术
注意力
电子设备
编码模块
处理器
可读存储介质
存储器
指令
计算机
数值
系统为您推荐了相关专利信息
数据存取模块
SRAM读写控制
加速器
芯片系统
子模块
医疗诊断方法
病变特征
大数据分析模型
纹理特征
灰度共生矩阵
单极子交叉环天线
MUSIC算法
测向方法
噪声子空间
信号
入侵识别方法
分布式声波传感
数据分布
二维声场
光纤传感器