基于多模态的手语合成服务方法

AITNT
正文
推荐专利
基于多模态的手语合成服务方法
申请号:CN202510842014
申请日期:2025-06-23
公开号:CN120823294A
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了一种基于多模态的手语合成服务方法,包括以下步骤:S10,进行端‑云协同渲染设置:将边缘端部署为轻量化模型生成基础动作,云端部署为运行MoMask与3D渲染引擎;S20,进行多模态数据采集:通过麦克风采集语音信号,摄像头采集48×48像素面部灰度图像,IMU传感器采集动作姿态数据;S30,将采集的多模态数据进行情感特征提取:进行语音情感识别输出六类情感概率分布,进行面部表情识别输出七类表情概率分布;S40,进行跨模态特征融合:基于置信度加权策略动态融合语音与面部特征,生成3维情感强度向量;S50,进行手语动作生成:通过RVQ分层量化与MoMask Transformer,生成情感适配的3D骨骼序列。
技术关键词
手语 令牌 语音情感识别 面部表情识别 IMU传感器 多模态数据采集 面部特征 序列 云端 Unity3D引擎 跨模态 基础 线性预测倒谱系数 表情特征 情感特征 频谱特征 动态 语音特征
系统为您推荐了相关专利信息
1
一种基于图像分析的环保设备运维行为分析方法及系统
光照强度数据 环保设备 机器学习模型 图像分析 分析方法
2
基于实体描述和软提示增强的知识图谱补全方法及系统
知识图谱补全方法 实体 序列 文本 注意力机制
3
一种用于电力交易的数据安全保护方法
数据安全保护方法 生物特征识别 国密SM4算法 登记阶段 电力
4
一种基于混合Transformer的工业图像缺陷检测系统
补丁 图像缺陷检测 网络模块 交叉注意力机制 上采样
5
一种基于造影剂增强核磁共振影像的小鼠肿瘤检测方法
肿瘤检测方法 造影剂 令牌 影像 小鼠
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号