基于语音输入的个性化全身动作生成方法

正文

推荐专利

基于语音输入的个性化全身动作生成方法

申请号：CN202510406940

申请日期：2025-04-02

公开号：CN120339475A

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种基于语音输入的个性化全身动作生成方法，该方法包括：获取适用于人体模型的身体参数，以及提取用户的音频特征；基于身体参数，针对头部模型和身体模型，分别构建来自两个变分自编码器的的分离量化潜在空间；从用户的音频特征中提取节奏和文本内容，为头部模型和身体模型分别生成融合有音频的内容和节奏且相适宜的特征表示；遮罩姿势进行处理，编码有效的身体提示信息，并通过时间交叉注意力选择性融合音频特征和身体提示信息，实现遮罩姿势的重建；分别解码头部和身体的动作信息，并估计全局平移，生成最终的全身动作。本发明充分挖掘和利用数据特征提高动作生成的准确性和自然度，使得生成的动作更符合音频内容。

技术关键词

动作生成方法音频特征头部模型节奏特征人体模型姿势参数头部动作信息身体姿态数据人体生理特征交叉注意力机制时间卷积网络卷积编码器处理器解码矢量量化

系统为您推荐了相关专利信息

一种电极、电极系统及电渗递送系统

电极主体电极系统递送系统医学图像数据钴基合金材料

基于音视频数据特征分析的广告智能识别方法及系统

音频特征调控策略智能识别方法关键词关键点

基于机器学习的新生儿哭声识别系统

哭声识别混合核函数 K近邻算法时域特征提取频域特征提取

一种医用增强现实系统

真实世界图像现实系统图像处理模块信息存储单元坐标

基于深度神经网络的听诊器音频识别方法、系统及装置

听诊器音频识别方法深度神经网络信号预处理模块音频特征信息

基于语音输入的个性化全身动作生成方法

站点导航

APP 下载