摘要
本申请属于人工智能技术领域,涉及一种语音处理方法、装置、计算机设备及存储介质,该方法包括:通过语音识别与合成模型,采用文本编码器预网络提取文本数据的目标文本特征向量;采用语音编码器预网络提取语音数据的目标语音特征向量;将目标文本特征向量、目标语音特征向量和任务向量结合得到目标任务融合向量;采用文本解码器后网络对目标任务融合向量进行处理,输出目标合成文本数据;采用语音解码器后网络对目标任务融合向量进行处理,输出目标合成语音数据。此外,本申请还涉及区块链技术,文本数据和语音数据等数据可存储于区块链中。本申请能够降低语音处理模型所需的计算资源和时间消耗。
技术关键词
语音解码器
语音编码器
文本特征向量
文本编码器
网络
计算机可读指令
训练文本数据
计算机设备
序列
线性
可读存储介质
上采样
人工智能技术
数据获取模块
区块链技术
处理器
系统为您推荐了相关专利信息
超表面彩色全息
器件设计方法
深度神经网络模型
色差
多波长
隧道病害识别系统
Hessian矩阵
便携式设备
数据储存模块
无线通信模块