摘要
本申请涉及金融科技技术领域,提供了一种语音解耦方法、装置、电子设备及计算机可读存储介质,方法包括:获取待解耦语音信号;将所解耦语音信号输入至预训练的编码器进行编码处理得到隐藏状态向量;对隐藏状态向量进行量化融合处理得到声学特征;以及对隐藏状态向量进行向量编码处理得到编码向量;对编码向量进行掩码处理得到掩码向量,将掩码向量输入至预训练的网络模型得到隐藏状态信息;对声学特征进行解码处理得到重构声学信息;以及对隐藏状态信息进行转换处理得到语义标识信息。通过上述技术方案,使得声学信息和语义信息得到解耦,从而提高了智能回答系统的语义反馈的准确性。
技术关键词
解耦方法
声学特征
编码向量
递归网络模型
语义
语音特征
计算机可执行指令
标识
编码器
译码模块
可读存储介质
金融科技技术
编码模块
回答系统
解耦装置
电子设备
信号
系统为您推荐了相关专利信息
多模态数据融合
红外热成像模块
汽车紧固件
状态检测系统
机器视觉模块
互动系统
数据分析模块
群体智能算法
多模态
数据采集模块
摘要生成方法
三通道
预训练模型
摘要生成系统
异构