一种混合语音分离方法、装置、设备及可读存储介质

正文

推荐专利

申请号：CN202410977922

申请日期：2024-07-22

公开号：CN118538234A

公开日期：2024-08-23

类型：发明专利

摘要

本发明公开了一种混合语音分离方法、装置、设备及可读存储介质，应用于语音分离领域，包括将含有语音重叠的混合语音输入至说话人提取模型的编码器中，得到输出向量；将混合语音中各个说话人的注册语音输入至声纹注册模型中，得到各个说话人的声纹特征；将各个说话人的声纹特征和输出向量依次输入至说话人提取模型的说话人提取器和解码器中，得到初始分离语音；将各个说话人的声纹特征和输出向量输入至说话人日志模型中，得到各个说话人的日志；根据初始分离语音和各个说话人的日志得到混合语音中各个说话人对应的语音。本发明将声纹注册模型、说话人日志模型和说话人提取模型进行结合，相辅相成，相互促进，共同提高混合语音分离的准确性。

技术关键词

声纹特征日志模型语音编码器计算机可执行指令输入模块解码器音频特征标签可读存储介质存储计算机程序特征提取模块样本处理器存储器场景网络

系统为您推荐了相关专利信息

一种用于金融业务办理的用户意愿度评估方法及装置

金融业务办理编码特征音视频多模态度评估方法

一种语言增强方法、装置、计算机设备及存储介质

音频编码器噪声语音数据语音特征解码网络

语音降噪模型的训练和语音降噪方法、装置、设备和介质

带噪语音信号降噪模型语音降噪方法语音降噪装置非线性

基于特征重建和混合深度学习的光伏发电功率预测方法

混合深度学习模型光伏发电功率天气长短期记忆网络数据

基于人工智能的智慧医疗信息交互系统

医疗信息交互系统智能交互终端多模态混合专家系统可穿戴传感器设备

一种混合语音分离方法、装置、设备及可读存储介质

站点导航

APP 下载