摘要
本申请提供一种训练数据的生成方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域,方法包括:对与第一音频数据对应的第一转录文本和音频特征序列进行处理,获得所述第一转录文本中各字符的时间戳信息;其中,所述第一转录文本包括第一语言类型字符;将所述第一转录文本中的目标字符翻译为第二语言类型字符,得到第二转录文本;将所述第二语言类型字符输入至语音合成模型,获得所述语音合成模型输出的第二音频数据;根据所述时间戳信息,对所述第一音频数据和所述第二音频数据进行处理,构造用于训练语码切换场景的模型的训练数据,其中,所述训练数据与所述第二转录文本对应。如此,能够低成本的构造大量的语码切换场景的训练数据。
技术关键词
字符
音频特征
文本
生成方法
索引
翻译模型
序列
自动语音识别
矩阵
处理器
场景
人工智能技术
计算机程序产品
注意力机制
数据更新
系统为您推荐了相关专利信息
张量恢复方法
卷积神经网络模型
随机噪声
索引
降噪模型
点云语义地图
数据
视觉
剔除噪声
三维点云地图构建