一种视频字幕的翻译同步方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202510650847

申请日期：2025-05-20

公开号：CN120321463A

公开日期：2025-07-15

类型：发明专利

摘要

本发明涉及视频处理技术，公开了一种视频字幕的翻译同步方法、系统、设备及存储介质。该方法包括：根据字幕时间对获取的音频源文件进行切分，得到音频片段；将属于目标角色的目标音频片段合并得到预测合并音频文件；根据字幕文件确定字幕内容，利用预设大语言模型将属于目标角色的相邻字幕内容并进行合并得到预测合并字幕文件；利用预测合并音频文件与预测合并字幕文件对字幕文件进行校验处理，得到目标字幕文件；对目标字幕文件进行翻译得到翻译字幕，根据翻译字幕合成目标翻译音频，根据目标翻译音频与音频源文件的长度关系对翻译字幕进行调整得到目标翻译字幕。本发明可以提升字幕对应角色的识别准确度。

技术关键词

翻译字幕音频同步方法大语言模型视频计算机设备计算机存储介质处理器关系模块存储器时间段语义

系统为您推荐了相关专利信息

一种面试评价方法、装置、电子设备和存储介质

文本语义向量评价方法轻量级卷积神经网络视频帧

一种目标检测方法、目标检测装置及终端设备

运动特征深度卷积神经网络关键点指标斯皮尔曼相关系数

目标大语言模型的确定方法、装置、设备、存储介质及程序产品

大语言模型网络模块问答对数据场景计算机可执行指令

一种引入文本模态的语音情感识别方法及相关装置

语音情感识别方法语音情感识别模型跨模态注意力机制编码模块

一种基于数据分析的医疗安全流程监管方法及系统

动作特征姿势监管方法风险点电子监控设备

一种视频字幕的翻译同步方法、系统、设备及存储介质

站点导航

APP 下载