摘要
本发明公开了一种支持多语言自动翻译的音视频处理方法,用于解决如何实现音视频系统的网页多国语言翻译,并高效实现音视频流的实时/准实时翻译的问题。多语言客户端通过云网络连接至设置有智能翻译网关的服务端;当通过浏览器获得由智能翻译网关返回的html源文件并进行网页渲染时,加载智能翻译组件,设置网页翻译语言;基于智能翻译组件查找网页的待翻译文本信息及实时音视频流;结合智能翻译网关对待翻译文本信息进行基于多维数组缓存调用的文本翻译,获得网页翻译语言下的文本翻译结果;从实时音视频流中实时提取音频信息,对音频信息进行基于切片块与双路径对齐的音频翻译,获得音频信息在网页翻译语言下的音频翻译结果。
技术关键词
翻译语言
多语言
网关
文本翻译模型
客户端
音频特征
切片
智能翻译器
音视频字幕
注意力机制
音视频系统
服务端
决策
队列
语音
加载单元
节点
系统为您推荐了相关专利信息
生成对抗网络
客户端
联邦学习系统
新型损失函数
混合损失函数
元素
信息处理方法
图片
非易失性计算机可读存储介质
计算机程序指令
差分隐私方法
中心服务器
模型更新
概率密度函数
客户端
预警管理系统
大数据
子模块
资源管理子系统
客户端