一种基于BPE的视频模态特征处理方法及系统

正文

推荐专利

申请号：CN202411082160

申请日期：2024-08-08

公开号：CN119110129A

公开日期：2024-12-10

类型：发明专利

摘要

本发明公开了一种基于BPE的视频模态特征处理方法及系统，方法包括将视频帧通过BPE算法进行合并，达到设定数量的视频帧后进行视频编码得到视频特征向量表示，或者将视频帧通过视频编码后再通过BPE算法进行合并得到视频帧特征向量；将文本进行编码得到文本特征向量表示；将文本特征向量表示和视频特征向量表示进行线性变换，或者将文本特征向量表示和视频帧特征向量进行线性变换，得到多模态特征向量表示；通过大语言模型处理多模态特征向量表示，生成多维度的视频内容表示。本发明通过BPE算法能够适应不同长度的视频内容，确保无论视频的长短，其关键信息都能得到有效保留，为video LLMs提供了数据基础，使其能够全面理解视频内容。

技术关键词

视频帧文本特征向量视频特征向量视频编码直方图大语言模型算法分段多模态特征对齐模块元素编码模块基础数据

系统为您推荐了相关专利信息

基于视觉-文本融合的水下图像增强方法及系统

水下图像增强方法颜色直方图水下图像增强系统预训练模型文本编码器

一种金属外观缺陷检测方法及系统

外观缺陷检测方法外观缺陷检测系统二值化图像缺陷类别金属件

一种氦泡诱发的检维修机器人关键部件材料性能退化数值模拟方法及系统

维修机器人数值模拟方法团簇尺寸性能退化规律物理性能参数

一种基于人工智能的电子证照签章识别与验证系统

验证系统数据采集模块电子机器学习算法图像识别算法

一种基于去噪扩散概率模型的肝外胆管癌MRI图像生成方法

图像生成方法胆管癌图像灰度直方图噪声样本造影剂

一种基于BPE的视频模态特征处理方法及系统

站点导航

APP 下载