音素对齐方法、装置、设备及介质

正文

推荐专利

音素对齐方法、装置、设备及介质

申请号：CN202510213529

申请日期：2025-02-24

公开号：CN119832928B

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及人工智能领域，提供了一种音素对齐方法、装置、设备及介质，方法包括：基于预先获取到的汉字序列确定汉字序列的文本特征；通过声学模型提取与汉字序列对应的音频信息的时频特征；通过强制对齐模型及时频特征对汉字序列及音频信息进行时间步长对齐，得到对齐后音频特征；对文本特征及对齐后音频特征进行融合，生成对应的联合嵌入特征；通过音素解码模型获取与联合嵌入特征对应的音素序列。本发明实施例可通过对文本特征及对齐后音频特征进行融合，生成对应的联合嵌入特征，实现精准捕捉发音规律，适应复杂的实际场景需求；本发明实施例还可通过音素解码模型获取与联合嵌入特征对应的音素序列，实现提高音素对齐的准确性及鲁棒性。

技术关键词

嵌入特征对齐方法音频特征汉字序列解码模型文本偏差解码模块处理器对齐装置注意力机制字符可读存储介质存储器鲁棒性发音电子设备

系统为您推荐了相关专利信息

一种基于自动驾驶车辆舒适性的制动控制方法

制动控制方法车辆俯仰角加速度深度强化学习算法预测控制模型

镜头缺陷检测模型训练方法、测试方法和可读存储介质

检测模型训练方法多通道图像数据镜头模型测试方法样本

基于深度学习的智慧隧道多模态数据协同管理方法及装置

空间拓扑关系多模态拓扑特征动态变化特征隧道

基于属性语义演化建模的序列推荐方法、电子设备及存储介质

序列推荐方法语义机器学习推荐系统动态掩码矩阵

新能源配电网保护测控装置、差动判别方法及计算机设备

新能源配电网保护测控装置配电网系统判别方法配电网故障定位技术

音素对齐方法、装置、设备及介质

站点导航

APP 下载