语音解耦方法、装置、电子设备及计算机可读存储介质

正文

推荐专利

申请号：CN202410865672

申请日期：2024-06-28

公开号：CN118609551B

公开日期：2025-11-25

类型：发明专利

摘要

本申请涉及金融科技技术领域，提供了一种语音解耦方法、装置、电子设备及计算机可读存储介质，方法包括：获取待解耦语音信号；将所解耦语音信号输入至预训练的编码器进行编码处理得到隐藏状态向量；对隐藏状态向量进行量化融合处理得到声学特征；以及对隐藏状态向量进行向量编码处理得到编码向量；对编码向量进行掩码处理得到掩码向量，将掩码向量输入至预训练的网络模型得到隐藏状态信息；对声学特征进行解码处理得到重构声学信息；以及对隐藏状态信息进行转换处理得到语义标识信息。通过上述技术方案，使得声学信息和语义信息得到解耦，从而提高了智能回答系统的语义反馈的准确性。

技术关键词

解耦方法声学特征编码向量递归网络模型语义语音特征计算机可执行指令标识编码器译码模块可读存储介质金融科技技术编码模块回答系统解耦装置电子设备信号

系统为您推荐了相关专利信息

一种基于AI与动态特征库的智能元素定位方法及系统

异常数据定位方法动态定位规则智能定位模块

一种基于人工智能的汽车紧固件状态检测方法及系统

多模态数据融合红外热成像模块汽车紧固件状态检测系统机器视觉模块

一种多模态英语学习互动系统及词汇记忆训练方法

互动系统数据分析模块群体智能算法多模态数据采集模块

一种基于RAG的提升私域运维知识检索质量的方法

合并单元格阶段数据结构识别表头大语言模型

一种基于三通道对比学习框架的摘要生成系统及方法

摘要生成方法三通道预训练模型摘要生成系统异构

语音解耦方法、装置、电子设备及计算机可读存储介质

站点导航

APP 下载