数据的处理方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411978907

申请日期：2024-12-30

公开号：CN119992644A

公开日期：2025-05-13

类型：发明专利

摘要

本发明实施例提供了一种数据的处理方法、装置、电子设备及存储介质，涉及计算机视觉技术领域，所述方法包括：获取视频生成模型以及针对视频生成模型的训练数据，训练数据包括音视频；对音视频进行特征提取，获得音视频对应的驱动信号以及音视频中每帧驱动图像对应的采样点的原始坐标；将各个采样点对应的原始坐标与驱动信号输入视频生成模型进行模型训练，获得判别器对应的第一损失函数以及动作编码器和外观编码器对应的第二损失函数；基于第一损失函数以及第二损失函数对视频生成模型进行参数调优，获得训练完成的视频生成模型，从而提升了模型处理的准确性且能够更加全面地捕捉说话者的面部动态，提高各自模态的驱动效果。

技术关键词

视频生成模型音视频驱动信号采样点音频特征编码器多维特征向量坐标汉字颜色计算机视觉技术拼音通信接口图像参数数据电子设备处理器

系统为您推荐了相关专利信息

一种储能锂离子电池容量异常识别方法、系统及设备

锂离子电池容量异常识别方法储能锂离子电池电池单体聚类算法

轨道场景下基于深度学习的音视频与图像融合监控分析系统及方法

监控分析系统音频音视频优化卡尔曼滤波协方差矩阵

一种视频生成方法、装置、设备及介质

多头注意力机制视频生成方法序列非易失性计算机可读存储介质视频生成模型

大尺度道路路面类型识别方法、介质及设备

道路路面采样点深度学习模型识别方法开放街道地图

图像处理方法、装置及存储介质

图像处理模型图像处理方法画面序列音频特征提取

数据的处理方法、装置、电子设备及存储介质

站点导航

APP 下载