发音预测方法、发音预测装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410921678

申请日期：2024-07-10

公开号：CN118471266B

公开日期：2024-09-03

类型：发明专利

摘要

本公开涉及计算机技术中语音处理领域，关于一种发音预测方法、发音预测装置、电子设备及存储介质。针对单一模态的数据无法应对复杂发音的问题，发音预测方法包括：获取待预测数据，并解析所述待预测数据的数据模态；基于发音预测模型和所述数据模态，对所述待预测数据进行发音预测，得到发音预测结果；其中，所述发音预测模型的输入为多模态数据，所述发音预测模型的输出为发音预测结果。通过本公开，实现了将多模态数据输入模型，对待预测数据进行发音预测，提高了发音预测的准确性。

技术关键词

发音标签多模态训练样本数据序列解码器架构自动编码器音频特征信息编码预测装置文本标识电子设备处理器指令

系统为您推荐了相关专利信息

来自IGF2BP1基因的SNPs组合及其应用

位点骨骼肌卫星细胞增殖双荧光素酶芯片基因

一种基于用户对齐Agent驱动的轻量化跨域推荐方法及系统

跨域推荐方法交互内容 Softmax函数图谱兴趣

一种血压测量方法

血压测量方法分段线性模型信号脉搏波传导时间离散小波变换

一种基于云计算的多模态异构数据实时融合与智能决策方法及其系统

智能决策方法协方差矩阵物理传感器子模块生成上下文感知

适用于未知攻击类型的深伪检测方法、设备、介质及产品

分类网络特征提取网络图像生理特征数据设备状态数据

发音预测方法、发音预测装置、电子设备及存储介质

站点导航

APP 下载