训练数据的生成方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
训练数据的生成方法、装置、设备、存储介质及程序产品
申请号:CN202410981906
申请日期:2024-07-22
公开号:CN118782015A
公开日期:2024-10-15
类型:发明专利
摘要
本申请提供一种训练数据的生成方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域,方法包括:对与第一音频数据对应的第一转录文本和音频特征序列进行处理,获得所述第一转录文本中各字符的时间戳信息;其中,所述第一转录文本包括第一语言类型字符;将所述第一转录文本中的目标字符翻译为第二语言类型字符,得到第二转录文本;将所述第二语言类型字符输入至语音合成模型,获得所述语音合成模型输出的第二音频数据;根据所述时间戳信息,对所述第一音频数据和所述第二音频数据进行处理,构造用于训练语码切换场景的模型的训练数据,其中,所述训练数据与所述第二转录文本对应。如此,能够低成本的构造大量的语码切换场景的训练数据。
技术关键词
字符 音频特征 文本 生成方法 索引 翻译模型 序列 自动语音识别 矩阵 处理器 场景 人工智能技术 计算机程序产品 注意力机制 数据更新
系统为您推荐了相关专利信息
1
基于大数据技术的兽医流行病学调查分析系统
语句 词语 大数据技术 分析系统 关键词
2
一种基于多维信息和强化学习的动态分组路由算法
节点 算法框架 深度学习网络 最大化算法 邻居
3
一种融合非凸低秩最小化和深度先验的张量恢复方法
张量恢复方法 卷积神经网络模型 随机噪声 索引 降噪模型
4
核电站防走错间隔人因事件识别方法和装置
防走错间隔 事件识别方法 核电站 语音 字符识别
5
一种两阶段式高精度三维点云语义地图构建方法
点云语义地图 数据 视觉 剔除噪声 三维点云地图构建
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号