训练数据的生成方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202410981906

申请日期：2024-07-22

公开号：CN118782015A

公开日期：2024-10-15

类型：发明专利

摘要

本申请提供一种训练数据的生成方法、装置、设备、存储介质及程序产品，涉及人工智能技术领域，方法包括：对与第一音频数据对应的第一转录文本和音频特征序列进行处理，获得所述第一转录文本中各字符的时间戳信息；其中，所述第一转录文本包括第一语言类型字符；将所述第一转录文本中的目标字符翻译为第二语言类型字符，得到第二转录文本；将所述第二语言类型字符输入至语音合成模型，获得所述语音合成模型输出的第二音频数据；根据所述时间戳信息，对所述第一音频数据和所述第二音频数据进行处理，构造用于训练语码切换场景的模型的训练数据，其中，所述训练数据与所述第二转录文本对应。如此，能够低成本的构造大量的语码切换场景的训练数据。

技术关键词

字符音频特征文本生成方法索引翻译模型序列自动语音识别矩阵处理器场景人工智能技术计算机程序产品注意力机制数据更新

系统为您推荐了相关专利信息

基于大数据技术的兽医流行病学调查分析系统

语句词语大数据技术分析系统关键词

一种基于多维信息和强化学习的动态分组路由算法

节点算法框架深度学习网络最大化算法邻居

一种融合非凸低秩最小化和深度先验的张量恢复方法

张量恢复方法卷积神经网络模型随机噪声索引降噪模型

核电站防走错间隔人因事件识别方法和装置

防走错间隔事件识别方法核电站语音字符识别

一种两阶段式高精度三维点云语义地图构建方法

点云语义地图数据视觉剔除噪声三维点云地图构建

训练数据的生成方法、装置、设备、存储介质及程序产品

站点导航

APP 下载