摘要
本发明提供一种同声传译模型训练方法、装置、设备及存储介质,涉及人工智能技术领域,方法包括:将源语言文字序列输入编码器,生成源语言文字序列的上下文表示;解码器结合历史生成的目标语言文字序列和源语言文字序列的上下文表示,通过掩码多头注意力机制进行推理,生成候选目标语言文字序列;基于翻译质量评估指标,将每个候选目标语言文字序列与源语言文字序列进行比较,确定每个候选目标语言文字序列的质量得分;将质量得分确定为目标函数的风险;采用梯度下降优化算法,最小化目标函数,根据目标函数通过反向传播算法对编码器和解码器进行迭代更新,生成同声传译模型。本发明可以训练出翻译的准确性和流畅性更高的同声传译模型。
技术关键词
同声传译
模型训练方法
序列
多头注意力机制
梯度下降优化算法
编码器
计算机可读取存储介质
语义向量
模型训练设备
解码器模型
模型训练装置
计算机可读指令
传播算法
模块
人工智能技术
指标
处理器