摘要
本发明公开了一种多模态面部动点数据与声带运动数据的数据处理方法及系统。该方法包括提供文本、采集正常人发声时的面部连续图像或视频与喉部振动数据、预处理数据、提取时间特征与空间特征、建立中文发声的面颈部运动模型,以及聋哑人依照模型进行模仿发声并获取反馈。该系统包括深度摄像头、喉部振动传感器和麦克风,通过综合利用多模态数据,为聋哑人提供即时反馈,降低学习门槛,提高交流效率,适用于全球范围内的聋哑人群体。该发明促进了语音发声训练,具有广泛的应用前景和社会意义。
技术关键词
数据处理方法
面部特征点
多模态
数据识别模型
发声训练系统
面部运动数据
轨迹
图像
麦克风
矫正
振动传感器
视频
信号
文本
模块
系统为您推荐了相关专利信息
节点数据处理方法
动态
周期
策略
节点数据处理系统
多模态数据融合
电子病历系统
多模态数据采集
特征提取模块
生物统计分析
激光雷达图像
分类网络
像素
融合多模态特征
高光谱激光雷达
低空无人机
模型构建方法
仿真模型
无人机姿态
多模态大数据