数据处理方法、装置、电子设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510992129

申请日期：2025-07-17

公开号：CN120832632A

公开日期：2025-10-24

类型：发明专利

摘要

本公开涉及一种数据处理方法、装置、电子设备、存储介质及程序产品；数据处理方法，包括：获取音频数据和视频数据；通过预训练的多模态模型，对音频数据和视频数据进行编码，得到在语义和时间上对齐的音频特征和视频特征；其中，预训练的多模态模型包括：预训练的音频编码器和预训练的视频编码器，预训练的音频编码器的结构与预训练的视频编码器的结构相同，预训练的音频编码器用于对音频数据进行编码，得到音频特征，预训练的视频编码器用于对视频数据进行编码，得到视频特征。该技术方案可以提升基于音视频数据所提取的音视频特征在语义和时间上的对齐度，进而提升涉及音视频数据的多模态任务的数据处理效果。

技术关键词

数据处理方法音频特征音频编码器视频编码器音视频样本采样率数据处理装置语义电子设备处理器计算机程序产品可读存储介质分辨率

系统为您推荐了相关专利信息

数据处理方法、装置、设备、介质及程序产品

小区栅格互联网系统数据处理方法生成训练样本

人脸鉴伪方法、装置、电子设备、存储介质及产品

鉴伪方法多模态特征视觉特征音频特征卷积模块

一种音视频记录仪记录文件的标注方法及系统

标注方法对音视频音视频记录仪 DTW算法网络抖动

一种基于人工智能的生物反馈设备数据处理方法

生物反馈设备数据处理方法编码器映射技术序列

一种基于人工智能的教育数据管理系统

教育数据管理系统分析模块数据存储管理规划参数

数据处理方法、装置、电子设备、存储介质及程序产品

站点导航

APP 下载