发音预测方法、发音预测装置、电子设备及存储介质

AITNT
正文
推荐专利
发音预测方法、发音预测装置、电子设备及存储介质
申请号:CN202410921678
申请日期:2024-07-10
公开号:CN118471266B
公开日期:2024-09-03
类型:发明专利
摘要
本公开涉及计算机技术中语音处理领域,关于一种发音预测方法、发音预测装置、电子设备及存储介质。针对单一模态的数据无法应对复杂发音的问题,发音预测方法包括:获取待预测数据,并解析所述待预测数据的数据模态;基于发音预测模型和所述数据模态,对所述待预测数据进行发音预测,得到发音预测结果;其中,所述发音预测模型的输入为多模态数据,所述发音预测模型的输出为发音预测结果。通过本公开,实现了将多模态数据输入模型,对待预测数据进行发音预测,提高了发音预测的准确性。
技术关键词
发音 标签 多模态 训练样本数据 序列 解码器架构 自动编码器 音频特征 信息编码 预测装置 文本 标识 电子设备 处理器 指令
系统为您推荐了相关专利信息
1
来自IGF2BP1基因的SNPs组合及其应用
位点 骨骼肌卫星细胞增殖 双荧光素酶 芯片 基因
2
一种基于用户对齐Agent驱动的轻量化跨域推荐方法及系统
跨域推荐方法 交互内容 Softmax函数 图谱 兴趣
3
一种血压测量方法
血压测量方法 分段线性模型 信号 脉搏波传导时间 离散小波变换
4
一种基于云计算的多模态异构数据实时融合与智能决策方法及其系统
智能决策方法 协方差矩阵 物理传感器 子模块 生成上下文感知
5
适用于未知攻击类型的深伪检测方法、设备、介质及产品
分类网络 特征提取网络 图像 生理特征数据 设备状态数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号