一种AI驱动的视频内容字幕同步翻译方法及系统

正文

推荐专利

申请号：CN202411137015

申请日期：2024-08-19

公开号：CN119996778A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开了一种AI驱动的视频内容字幕同步翻译方法及系统，涉及视频字幕同步技术领域，该系统结合视频帧采集模块和面部嘴唇动作识别模块，本系统能够精确获取每个角色的嘴唇开合垂直距离和开合次数。这些数据用于计算实际的说话语速，并与传统语速指数进行比较，得到第一校准差值系数。这种方法有效调整字幕的时间戳，减少因语速差异导致的时间偏差，使字幕与实际语音更为同步，从而提升了字幕的准确性和观众的观影体验。多人说话重叠识别模块能够精准检测和标记语音重叠情况。如果重叠语音影响因子D超出异常阈值F，系统会触发第二校正指令，进一步校准字幕时间戳，避免了因语音重叠造成的同步问题。

技术关键词

同步翻译系统语音音频字幕视频流开合次数识别模块校正模块文本关键点时间校准图像指数多通道信号处理技术因子翻译方法信号处理算法

系统为您推荐了相关专利信息

日程生成方法、装置、设备以及存储介质

日程生成方法文本标识符音频采集设备数据

一种盗版视频溯源方法及装置

盗版视频溯源方法指纹伪随机数生成器副本

一种基于双次识别定位增强的移动应用无障碍字幕识别方法和装置

字幕识别方法识别模块定位文本位置二次识别方法消息

数字人语音交互的处理方法、装置、电子设备和介质

音频数据语音识别模型文本深度学习网络模型

一种基于卡尔曼机制的自适应子带前向盲源分离方法

语音活动检测方法滤波器信号复杂度稳态误差

一种AI驱动的视频内容字幕同步翻译方法及系统

站点导航

APP 下载