一种AI驱动的视频内容字幕同步翻译方法及系统

AITNT
正文
推荐专利
一种AI驱动的视频内容字幕同步翻译方法及系统
申请号:CN202411137015
申请日期:2024-08-19
公开号:CN119996778A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种AI驱动的视频内容字幕同步翻译方法及系统,涉及视频字幕同步技术领域,该系统结合视频帧采集模块和面部嘴唇动作识别模块,本系统能够精确获取每个角色的嘴唇开合垂直距离和开合次数。这些数据用于计算实际的说话语速,并与传统语速指数进行比较,得到第一校准差值系数。这种方法有效调整字幕的时间戳,减少因语速差异导致的时间偏差,使字幕与实际语音更为同步,从而提升了字幕的准确性和观众的观影体验。多人说话重叠识别模块能够精准检测和标记语音重叠情况。如果重叠语音影响因子D超出异常阈值F,系统会触发第二校正指令,进一步校准字幕时间戳,避免了因语音重叠造成的同步问题。
技术关键词
同步翻译系统 语音 音频 字幕 视频流 开合次数 识别模块 校正模块 文本 关键点 时间校准 图像 指数 多通道信号处理技术 因子 翻译方法 信号处理算法
系统为您推荐了相关专利信息
1
日程生成方法、装置、设备以及存储介质
日程生成方法 文本 标识符 音频采集设备 数据
2
一种盗版视频溯源方法及装置
盗版视频 溯源方法 指纹 伪随机数生成器 副本
3
一种基于双次识别定位增强的移动应用无障碍字幕识别方法和装置
字幕识别方法 识别模块 定位文本位置 二次识别方法 消息
4
数字人语音交互的处理方法、装置、电子设备和介质
音频 数据 语音识别模型 文本 深度学习网络模型
5
一种基于卡尔曼机制的自适应子带前向盲源分离方法
语音活动检测方法 滤波器 信号 复杂度 稳态误差
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号