摘要
本发明公开了基于边云协同的平板电脑实时语音识别与翻译系统,涉及语音处理技术领域,包括,语音降噪模块,采用波束形成与深度残差网络进行多级增强,结合自适应噪声估计与注意力机制进行多通道特征融合,得到信噪比优化后的干净语音数据;语种识别模块,将干净语音数据输入语种识别网络,提取语音特征向量,并通过语种聚类模型进行语种识别并生成语种标签;翻译模块,根据初步的识别文本,通过语义理解与上下文建模,进行语义优化,并利用神经网络翻译模型进行翻译处理,生成翻译文本。本发明实现了在复杂声学环境中有效提升语音信号信噪比的技术效果。
技术关键词
语音识别网络
翻译系统
实时语音
语种识别
梅尔频率倒谱系数
文本
翻译模型
多通道特征融合
语义
声学特征
TDOA算法
电脑
平板
深度残差网络
滤波器
信号
标签
麦克风阵列
非线性特征提取
系统为您推荐了相关专利信息
运维管理系统
多媒体设备
可视化平台
动态基线模型
仿真验证系统
辅助肢体康复
生理信号采集装置
VR交互
传感模块
穿戴式传感器
翻译系统
视频采集模块
可视化窗口
视频输出模块
视频处理单元
拾音设备
麦克风
音频信号处理方法
滤波器系数
超材料