摘要
本发明提供一种基于深度学习的手机端面部动作恢复语音方法及系统,涉及语音处理技术领域,该方法包括调用手机加速度传感器实时同步采集面部加速度与语音数据并传输至电脑;在电脑端接收、对齐、存储数据并去噪以增强信噪比;构建模型,先由U‑Net模型将加速度信号转成4khz采样率的语音信号,再经SR‑model超分模型生成16khz采样率的语音信号;把处理后的面部加速度信号输入训练好的深度学习模型,生成语音并按需传出。本发明有效解决现有问题,实现从面部动作到语音的恢复,具有良好应用前景。
技术关键词
语音方法
采样率
手机加速度传感器
信号
面部
信噪比
滤波器算法
计算机软件产品
语音系统
分辨率提升
噪声功率
计算机存储介质
深度学习模型训练
总线系统
执行存储器存储
短时傅里叶变换
系统为您推荐了相关专利信息
人工智能模型
可编程逻辑控制器
器具结构
工业
控制器接口
二阶广义积分器
单相逆变器
有功功率
模拟同步发电机
频率控制回路
注意力模型
空间变换网络
多模态
心理检测系统
序列
拉瓦尔喷嘴
板式传送带
隶属度函数
采收装置
压电传感器