动作数据生成方法、装置、设备、存储介质和程序产品

正文

推荐专利

申请号：CN202510260633

申请日期：2025-03-06

公开号：CN119741405B

公开日期：2025-06-10

类型：发明专利

摘要

本申请公开了一种动作数据生成方法、装置、设备、存储介质和程序产品，涉及人工智能技术领域，包括：获得目标语音的音频特征以及目标语音对应的文本；基于对文本的语义理解，确定文本中需要数字人同步执行肢体动作的目标文本段，每个目标文本段对应的肢体动作的类别，以及每个目标文本段对应的待生成的骨架动作序列中的各个动作帧的位置编码；对应每个目标文本段，至少将音频特征、该目标文本段对应的肢体动作的类别以及该目标文本段对应的各个动作帧的位置编码作为扩散模型的控制条件，通过扩散模型生成与该目标文本段对应的骨架动作序列。本申请提高了基于骨架动作序列驱动的数字人的肢体动作与语音内容的匹配度。

技术关键词

文本标记标签音频特征序列数据生成方法骨架特征节奏特征视频电子设备计算机可读指令编码训练样本集姿态估计噪声数据生成装置语音信号处理语义手部关键点意图

系统为您推荐了相关专利信息

一种针对大模型的自适应检索增强问答系统及其问答方法

问答方法专业知识库大语言模型问答系统数据

一种人物社会关系判定方法及装置

判定方法社交机器可读程序假设解码器大数据分析技术

基于玻璃纳米孔和纳米操纵的核酸检测系统及其制备方法与应用

核酸检测系统 DNA芯片生物素引物纳米孔技术

一种基于频率和权重的缓存优化方法、装置、设备及介质

数据项缓存优化方法布隆过滤器指纹计数器

一种基于微弱目标的抗干扰型空中智能感知方法

智能感知方法多传感器融合设计智能感知系统剔除算法深度学习模型

动作数据生成方法、装置、设备、存储介质和程序产品

站点导航

APP 下载