摘要
本申请公开了一种同传翻译训练数据生成方法、相关设备及程序产品,涉及同声传译技术领域。本申请基于双语字幕音视频数据中的双语字幕信息,获取每一音频片段对应的第一源语言文本和第一目标语言文本,音频片段为双语字幕音视频数据中音频所包含的一个片段;对音频片段进行语音识别,得到音频片段对应的第二源语言文本;按照配置的源语言对齐规则,利用第一源语言文本对第二源语言文本进行对齐,得到源语言对齐文本并筛选源语言对齐文本对应的目标音频片段;基于目标音频片段,及目标音频片段对应的第一目标语言文本,生成同传翻译训练数据。本申请无需人工标注,节省了人工成本,且提高了训练数据获取效率。
技术关键词
文本
双语字幕
训练数据生成方法
音频
音视频
视频帧
外挂字幕
语音活动性检测
同声传译技术
元素
翻译模型
计算机程序产品
处理器
编辑
可读存储介质
存储器
系统为您推荐了相关专利信息
作业批改方法
NFC技术
图像识别技术
学生
身份识别模块
多层级标签
生成训练样本
计算机执行指令
标签组
编码策略
音频控制方法
多设备协同
空间位置关系
音频设备
测距模块