一种同步语音与手语展示的多模态交互方法及装置

正文

推荐专利

申请号：CN202510410044

申请日期：2025-04-02

公开号：CN120339476A

公开日期：2025-07-18

类型：发明专利

摘要

本发明涉及一种同步语音与手语展示的多模态交互方法及装置，属于语音图像数据处理技术领域，其中，该同步语音与手语展示的多模态交互方法包括：基于手语语义特征向量和语音韵律特征向量之间的语义差异损失确定距离度量，基于距离度量和DTW算法对手语语义特征向量和语音韵律特征向量进行时间同步；将情感特征向量与时间同步后的手语语义特征向量和语音韵律特征向量融合，生成多模态特征序列；基于多模态特征序列生成手语动作、面部表情和唇形，控制数字人进行展示。本发明在保证数字人手语动作与语音输出一致的同时表达了情感信息，提高了用户体验。

技术关键词

手语语音多模态特征交互方法语义时间同步生成对抗网络训练度量面部 DTW算法图像数据处理技术情感特征融合注意力机制序列反向运动学正向运动学样本元素存储器

系统为您推荐了相关专利信息

一种基于大语言模型的运营商数据分类方法

数据分类方法大语言模型生成知识图谱标签实体

一种基于长短期依赖的时序知识图谱推理方法

知识图谱推理方法实体关系时序矩阵

基于表关联的数据查询方法及装置

神经网络模型数据查询方法关系图谱字段

一种超长上下文建模的大幅面遥感影像语义分割方法

注意力模型解码器多层感知机非暂态计算机可读存储介质语义

一种基于康养陪护机器人的多任务智能协调执行方法及系统

陪护机器人多任务生命体征数据多模态注意力情感分析模型

一种同步语音与手语展示的多模态交互方法及装置

站点导航

APP 下载