一种基于深度学习的协同语音手势生成方法及系统

正文

推荐专利

申请号：CN202411741973

申请日期：2024-11-29

公开号：CN119577686A

公开日期：2025-03-07

类型：发明专利

摘要

本发明公开了一种基于深度学习的协同语音手势生成方法及系统，方法包括：获取初始手势序列，对初始手势序列进行前向扩散，得到扰动序列；获取语音特征、初始姿态特征和时间嵌入向量，对语音特征、初始姿态特征和时间嵌入向量进行跨模态融合，得到多模态特征；使用扩展长短期记忆网络在多模特征的指导下对扰动序列迭代去噪，得到新的手势序列。本发明结合使用扩展长短期记忆网络与扩展模型，能够有效捕捉到不同多模态特征与手势之间的相关性，帮助从条件信息中推断自然且富有表现力的手势，使得生成的协同手势具有更高的质量和多样性。

技术关键词

手势生成方法姿态特征长短期记忆网络多模态特征序列多模特征跨模态表达式语音特征提取噪声微处理器协方差矩阵生成系统可读存储介质解码器线性

系统为您推荐了相关专利信息

一种基于图像处理的奶粉质量检测方法及系统

像素点代表邻域层次聚类算法识别杂质

一种基于对比学习的仇恨言论检测方法、装置和计算机设备

对话生成模型敏感关键词标签样本语义

一种面料防静电检测数据智能分类方法

数据智能分类防静电面料 CART决策树电阻测试仪

基于智能传感的粘性金精矿自动化取样系统

取样系统状态反馈信号流变特征矿浆精矿

一种碳酸钙制造流程中的粉尘控制方法

监测粉尘激光粒度分析仪数据粉尘控制方法闭环优化控制

一种基于深度学习的协同语音手势生成方法及系统

站点导航

APP 下载