基于多模态的手语合成服务方法

正文

推荐专利

基于多模态的手语合成服务方法

申请号：CN202510842014

申请日期：2025-06-23

公开号：CN120823294A

公开日期：2025-10-21

类型：发明专利

摘要

本发明公开了一种基于多模态的手语合成服务方法，包括以下步骤：S10，进行端‑云协同渲染设置：将边缘端部署为轻量化模型生成基础动作，云端部署为运行MoMask与3D渲染引擎；S20，进行多模态数据采集：通过麦克风采集语音信号，摄像头采集48×48像素面部灰度图像，IMU传感器采集动作姿态数据；S30，将采集的多模态数据进行情感特征提取：进行语音情感识别输出六类情感概率分布，进行面部表情识别输出七类表情概率分布；S40，进行跨模态特征融合：基于置信度加权策略动态融合语音与面部特征，生成3维情感强度向量；S50，进行手语动作生成：通过RVQ分层量化与MoMask Transformer，生成情感适配的3D骨骼序列。

技术关键词

手语令牌语音情感识别面部表情识别 IMU传感器多模态数据采集面部特征序列云端 Unity3D引擎跨模态基础线性预测倒谱系数表情特征情感特征频谱特征动态语音特征

系统为您推荐了相关专利信息

一种基于图像分析的环保设备运维行为分析方法及系统

光照强度数据环保设备机器学习模型图像分析分析方法

基于实体描述和软提示增强的知识图谱补全方法及系统

知识图谱补全方法实体序列文本注意力机制

一种用于电力交易的数据安全保护方法

数据安全保护方法生物特征识别国密SM4算法登记阶段电力

一种基于混合Transformer的工业图像缺陷检测系统

补丁图像缺陷检测网络模块交叉注意力机制上采样

一种基于造影剂增强核磁共振影像的小鼠肿瘤检测方法

肿瘤检测方法造影剂令牌影像小鼠

基于多模态的手语合成服务方法

站点导航

APP 下载