一种同步语音与手语展示的多模态交互方法及装置

AITNT
正文
推荐专利
一种同步语音与手语展示的多模态交互方法及装置
申请号:CN202510410044
申请日期:2025-04-02
公开号:CN120339476A
公开日期:2025-07-18
类型:发明专利
摘要
本发明涉及一种同步语音与手语展示的多模态交互方法及装置,属于语音图像数据处理技术领域,其中,该同步语音与手语展示的多模态交互方法包括:基于手语语义特征向量和语音韵律特征向量之间的语义差异损失确定距离度量,基于距离度量和DTW算法对手语语义特征向量和语音韵律特征向量进行时间同步;将情感特征向量与时间同步后的手语语义特征向量和语音韵律特征向量融合,生成多模态特征序列;基于多模态特征序列生成手语动作、面部表情和唇形,控制数字人进行展示。本发明在保证数字人手语动作与语音输出一致的同时表达了情感信息,提高了用户体验。
技术关键词
手语 语音 多模态特征 交互方法 语义 时间同步 生成对抗网络训练 度量 面部 DTW算法 图像数据处理技术 情感特征 融合注意力机制 序列 反向运动学 正向运动学 样本 元素 存储器
系统为您推荐了相关专利信息
1
一种基于大语言模型的运营商数据分类方法
数据分类方法 大语言模型 生成知识图谱 标签 实体
2
一种基于长短期依赖的时序知识图谱推理方法
知识图谱推理方法 实体 关系 时序 矩阵
3
基于表关联的数据查询方法及装置
神经网络模型 数据查询方法 关系 图谱 字段
4
一种超长上下文建模的大幅面遥感影像语义分割方法
注意力模型 解码器 多层感知机 非暂态计算机可读存储介质 语义
5
一种基于康养陪护机器人的多任务智能协调执行方法及系统
陪护机器人 多任务 生命体征数据 多模态注意力 情感分析模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号