摘要
本申请公开了一种单通道语音转录方法及装置、电子设备、存储介质,所述方法包括:采集单通道的当前原始混合语音信号,并对其进行时频域预处理,得到当前原始混合语音信号的幅度谱和相位谱;通过矩阵分解模型对幅度谱进行非负矩阵分解后,利用分解结果计算时频掩码,并利用时频掩码与该幅度谱进行信号重建,输出多个当前分离语音幅度谱;其中,通过将矩阵分解模型和神经网络模型联合优化训练;利用当前原始混合语音信号的相位谱,对各个当前分离语音幅度谱进行转化,得到各个当前分离语音;通过语音转录模型对各个当前分离语音进行语音识别和敏感词分类,并将语音识别文本与敏感词分类结果融合后,输出屏蔽敏感词的各个当前分离语音的转录文本。
技术关键词
矩阵分解模型
语音转录方法
语音识别文本
词典
信号
输入神经网络模型
矩阵分解算法
语音识别模型
梯度下降算法
优化训练方法
语音识别单元
转录装置
编码器
电子设备
计算机存储介质
存储计算机程序
系统为您推荐了相关专利信息
智能评估系统
脑电信号分析
脑电信号采集模块
情景
触觉刺激模块
公网
载波频率偏差
反馈控制模块
PID控制器
信号采集模块
触控系统
噪声检测方法
噪声检测装置
通道
驱动信号
主动降噪系统
异音检测方法
信号
功率
异音检测装置
光电封装结构
光芯片
封装基板
垂直腔面发射激光器芯片
电互连结构