动作合成方法、装置、设备、系统及程序产品

AITNT
正文
推荐专利
动作合成方法、装置、设备、系统及程序产品
申请号:CN202411486623
申请日期:2024-10-23
公开号:CN119648874A
公开日期:2025-03-18
类型:发明专利
摘要
本说明书实施例提供了一种动作合成方法,该方法通过确定输入视频相应关键点序列;然后基于关键点序列执行加噪处理;并在对噪声序列进行去噪处理的过程中,将噪声序列和特征信息作为条件引导扩散概率模型执行分段训练进程,其第一阶段基于音频特征进行,其第二阶段在第一阶段的隐空间中基于语义特征进行;该训练后的扩散概率模型可以用于合成对象动作。应用上述训练得到的扩散概率模型能够实现多样性的动作合成过程,由于在训练进程中第二阶段在第一阶段隐空间继续生成稳定的序列结构,在音频特征的基础上,细化描述了语义特征,提高了动作合成的准确性。
技术关键词
音频特征 语义特征 标识特征 序列 对象 视频帧 进程 噪声 关键点 服务端 输出特征 模块 风格 客户端 数据 计算机程序产品 注意力机制 处理器
系统为您推荐了相关专利信息
1
甲基丙二酸半醛脱氢酶1 K113Q质粒及其应用
脱氢酶 细胞模型 质粒 甲基 房颤动物模型
2
基于源码预训练模型的鲁棒性验证方法、系统及存储介质
预训练模型 鲁棒性验证方法 令牌 标签 序列切片
3
基于事件流的视频重建方法、装置、电子设备及存储介质
卷积神经网络模型 事件流数据 卷积长短期记忆 动态场景 多通道
4
基于大语言模型的对话生成方法及装置、存储介质、终端
音频编码器 音频特征 音频解码器 大语言模型 对话生成方法
5
基于机器视觉的水果质量智能综合分级系统
像素点 分级系统 水果图像 特征点 关键点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号