动作合成方法、装置、设备、系统及程序产品

正文

推荐专利

申请号：CN202411486623

申请日期：2024-10-23

公开号：CN119648874A

公开日期：2025-03-18

类型：发明专利

摘要

本说明书实施例提供了一种动作合成方法，该方法通过确定输入视频相应关键点序列；然后基于关键点序列执行加噪处理；并在对噪声序列进行去噪处理的过程中，将噪声序列和特征信息作为条件引导扩散概率模型执行分段训练进程，其第一阶段基于音频特征进行，其第二阶段在第一阶段的隐空间中基于语义特征进行；该训练后的扩散概率模型可以用于合成对象动作。应用上述训练得到的扩散概率模型能够实现多样性的动作合成过程，由于在训练进程中第二阶段在第一阶段隐空间继续生成稳定的序列结构，在音频特征的基础上，细化描述了语义特征，提高了动作合成的准确性。

技术关键词

音频特征语义特征标识特征序列对象视频帧进程噪声关键点服务端输出特征模块风格客户端数据计算机程序产品注意力机制处理器

系统为您推荐了相关专利信息

甲基丙二酸半醛脱氢酶1 K113Q质粒及其应用

脱氢酶细胞模型质粒甲基房颤动物模型

基于源码预训练模型的鲁棒性验证方法、系统及存储介质

预训练模型鲁棒性验证方法令牌标签序列切片

基于事件流的视频重建方法、装置、电子设备及存储介质

卷积神经网络模型事件流数据卷积长短期记忆动态场景多通道

基于大语言模型的对话生成方法及装置、存储介质、终端

音频编码器音频特征音频解码器大语言模型对话生成方法

基于机器视觉的水果质量智能综合分级系统

像素点分级系统水果图像特征点关键点

动作合成方法、装置、设备、系统及程序产品

站点导航

APP 下载