一种单通道语音转录方法及装置、电子设备、存储介质

正文

推荐专利

申请号：CN202510986182

申请日期：2025-07-17

公开号：CN120496536A

公开日期：2025-08-15

类型：发明专利

摘要

本申请公开了一种单通道语音转录方法及装置、电子设备、存储介质，所述方法包括：采集单通道的当前原始混合语音信号，并对其进行时频域预处理，得到当前原始混合语音信号的幅度谱和相位谱；通过矩阵分解模型对幅度谱进行非负矩阵分解后，利用分解结果计算时频掩码，并利用时频掩码与该幅度谱进行信号重建，输出多个当前分离语音幅度谱；其中，通过将矩阵分解模型和神经网络模型联合优化训练；利用当前原始混合语音信号的相位谱，对各个当前分离语音幅度谱进行转化，得到各个当前分离语音；通过语音转录模型对各个当前分离语音进行语音识别和敏感词分类，并将语音识别文本与敏感词分类结果融合后，输出屏蔽敏感词的各个当前分离语音的转录文本。

技术关键词

矩阵分解模型语音转录方法语音识别文本词典信号输入神经网络模型矩阵分解算法语音识别模型梯度下降算法优化训练方法语音识别单元转录装置编码器电子设备计算机存储介质存储计算机程序

系统为您推荐了相关专利信息

一种基于脑电的意识障碍智能评估系统

智能评估系统脑电信号分析脑电信号采集模块情景触觉刺激模块

基于公网信号扫描的压控晶振频率调整方法

公网载波频率偏差反馈控制模块 PID控制器信号采集模块

触控系统噪声检测方法及装置、触控芯片、终端设备

触控系统噪声检测方法噪声检测装置通道驱动信号

主动降噪系统及其控制方法、异音检测方法、装置

主动降噪系统异音检测方法信号功率异音检测装置

光电封装结构

光电封装结构光芯片封装基板垂直腔面发射激光器芯片电互连结构

一种单通道语音转录方法及装置、电子设备、存储介质

站点导航

APP 下载