处理视频数据的方法和装置

正文

推荐专利

处理视频数据的方法和装置

申请号：CN202411844742

申请日期：2024-12-13

公开号：CN119693756A

公开日期：2025-03-25

类型：发明专利

摘要

本公开涉及一种处理视频数据的方法、训练神经网络的方法、处理视频数据的装置、电子设备及计算机可读存储介质。本公开实施例实现了像素级的视觉特征与文本特征在多语义层面的细粒度融合。在一个可选方面，本公开实施例在视觉特征与文本特征处理的早期阶段，以层次化的且细粒度的方式将文本特征与视觉特征进行融合。由此本公开的实施例能够充分地应用文本数据，大幅度地提升了RMOT任务的性能。在另一个可选方面，本公开实施例利用文本引导解码器，在解码过程中为查询提供先验语义信息，使得解码器能够更加充分地利用文本数据中的语义信息，提升待识别目标的嵌入的表现能力。

技术关键词

融合特征识别特征文本视觉特征查询特征多模态语义特征视频帧识别模块数据空间坐标信息像素样本计算机可执行程序训练神经网络输入解码器

系统为您推荐了相关专利信息

一种基于大数据的企业税务分析系统

企业税务分析系统大数据协议文本解析动态数据采集模块

基于多模态和差异增强的胆管癌淋巴结钙化点检测方法

钙化点检测方法胆管癌多模态实时检测系统超声图像数据

查询系统的调整方法、装置、电子设备、介质及产品

查询策略查询系统模拟退火算法电子设备频率

一种基于扩散模型的数据和标签的生成方法及相关装置

图像生成方法标签深度卷积神经网络模型实例分割模型

一种在线智能图像加密方法及系统

图像加密方法白名单物体图像加密算法在线

处理视频数据的方法和装置

站点导航

APP 下载