支持多语言自动翻译的音视频处理方法

AITNT
正文
推荐专利
支持多语言自动翻译的音视频处理方法
申请号:CN202510217826
申请日期:2025-02-26
公开号:CN119993160A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种支持多语言自动翻译的音视频处理方法,用于解决如何实现音视频系统的网页多国语言翻译,并高效实现音视频流的实时/准实时翻译的问题。多语言客户端通过云网络连接至设置有智能翻译网关的服务端;当通过浏览器获得由智能翻译网关返回的html源文件并进行网页渲染时,加载智能翻译组件,设置网页翻译语言;基于智能翻译组件查找网页的待翻译文本信息及实时音视频流;结合智能翻译网关对待翻译文本信息进行基于多维数组缓存调用的文本翻译,获得网页翻译语言下的文本翻译结果;从实时音视频流中实时提取音频信息,对音频信息进行基于切片块与双路径对齐的音频翻译,获得音频信息在网页翻译语言下的音频翻译结果。
技术关键词
翻译语言 多语言 网关 文本翻译模型 客户端 音频特征 切片 智能翻译器 音视频字幕 注意力机制 音视频系统 服务端 决策 队列 语音 加载单元 节点
系统为您推荐了相关专利信息
1
一种基于生成对抗网络的联邦学习图像推理攻击方法
生成对抗网络 客户端 联邦学习系统 新型损失函数 混合损失函数
2
信息处理方法、装置、电子设备及可读存储介质
元素 信息处理方法 图片 非易失性计算机可读存储介质 计算机程序指令
3
基于瑞丽散度和自适应噪声调节的联邦学习差分隐私方法
差分隐私方法 中心服务器 模型更新 概率密度函数 客户端
4
一种基于自监督知识蒸馏的无源域适应联邦学习方法
联邦学习方法 客户端 标签 学生 蒸馏
5
一种食品大数据价格预警管理系统及方法
预警管理系统 大数据 子模块 资源管理子系统 客户端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号