一种单通道语音转录方法及装置、电子设备、存储介质

AITNT
正文
推荐专利
一种单通道语音转录方法及装置、电子设备、存储介质
申请号:CN202510986182
申请日期:2025-07-17
公开号:CN120496536A
公开日期:2025-08-15
类型:发明专利
摘要
本申请公开了一种单通道语音转录方法及装置、电子设备、存储介质,所述方法包括:采集单通道的当前原始混合语音信号,并对其进行时频域预处理,得到当前原始混合语音信号的幅度谱和相位谱;通过矩阵分解模型对幅度谱进行非负矩阵分解后,利用分解结果计算时频掩码,并利用时频掩码与该幅度谱进行信号重建,输出多个当前分离语音幅度谱;其中,通过将矩阵分解模型和神经网络模型联合优化训练;利用当前原始混合语音信号的相位谱,对各个当前分离语音幅度谱进行转化,得到各个当前分离语音;通过语音转录模型对各个当前分离语音进行语音识别和敏感词分类,并将语音识别文本与敏感词分类结果融合后,输出屏蔽敏感词的各个当前分离语音的转录文本。
技术关键词
矩阵分解模型 语音转录方法 语音识别文本 词典 信号 输入神经网络模型 矩阵分解算法 语音识别模型 梯度下降算法 优化训练方法 语音识别单元 转录装置 编码器 电子设备 计算机存储介质 存储计算机程序
系统为您推荐了相关专利信息
1
一种基于脑电的意识障碍智能评估系统
智能评估系统 脑电信号分析 脑电信号采集模块 情景 触觉刺激模块
2
基于公网信号扫描的压控晶振频率调整方法
公网 载波频率偏差 反馈控制模块 PID控制器 信号采集模块
3
触控系统噪声检测方法及装置、触控芯片、终端设备
触控系统 噪声检测方法 噪声检测装置 通道 驱动信号
4
主动降噪系统及其控制方法、异音检测方法、装置
主动降噪系统 异音检测方法 信号 功率 异音检测装置
5
光电封装结构
光电封装结构 光芯片 封装基板 垂直腔面发射激光器芯片 电互连结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号