摘要
本公开涉及计算机技术中语音处理领域,关于一种发音预测方法、发音预测装置、电子设备及存储介质。针对单一模态的数据无法应对复杂发音的问题,发音预测方法包括:获取待预测数据,并解析所述待预测数据的数据模态;基于发音预测模型和所述数据模态,对所述待预测数据进行发音预测,得到发音预测结果;其中,所述发音预测模型的输入为多模态数据,所述发音预测模型的输出为发音预测结果。通过本公开,实现了将多模态数据输入模型,对待预测数据进行发音预测,提高了发音预测的准确性。
技术关键词
发音
标签
多模态
训练样本数据
序列
解码器架构
自动编码器
音频特征
信息编码
预测装置
文本
标识
电子设备
处理器
指令
系统为您推荐了相关专利信息
跨域推荐方法
交互内容
Softmax函数
图谱
兴趣
血压测量方法
分段线性模型
信号
脉搏波传导时间
离散小波变换
智能决策方法
协方差矩阵
物理传感器
子模块
生成上下文感知
分类网络
特征提取网络
图像
生理特征数据
设备状态数据