摘要
本申请提供了一种翻译方法、视频会议方法及电子设备,用于同声传译技术领域,该方法包括:获取原声语言文本中待翻译的当前词,利用第一对象生成当前词对应的嵌入向量,将嵌入向量传输给编码器,获取编码器生成的与嵌入向量对应的第一编码器kv缓存;利用第二对象处理第一编码器kv缓存生成第二编码器kv缓存;通过解码器处理第二编码器kv缓存、当前词对应的上一词以及历史解码器kv缓存生成目标解码器kv缓存、预测矩阵,利用第一对象处理预测矩阵以得到当前词的翻译结果。本申请能够减少翻译模型的内存占用,从而将翻译模型嵌入会议终端,无需利用服务器进行翻译,有效降低算力成本,减少网络延迟的影响,提升视频会议的稳定性。
技术关键词
解码器
编码器
翻译方法
视频会议方法
对象
会议终端
翻译模型
同声传译技术
矩阵
文本
电子设备
深度学习模型
音频
模块
存储器
数据
处理器
内存
系统为您推荐了相关专利信息
音频特征
情绪分析方法
视频
多模态情绪
注意力机制
音频特征
语音生成方法
序列
语音解码器
生成语音