摘要
本发明提供一种基于语义分割的视频多语言转换方法及系统,用于解决现有视频多语言转换中语义割裂、处理效率低下的技术问题。该方法首先对输入视频进行音视频分离预处理,提取音频流和视频流;然后基于音频流进行语音特征提取,获取音素、停顿和语调特征,并进行语音识别得到文本特征;根据语音和文本特征确定语义切分点,生成语义分片;将语义分片转换为独立任务,通过并行处理框架执行多语言转换;最后对处理后的语义分片进行合成,生成目标语言的视频。本发明通过语义分割技术保证了语义的完整性,采用并行处理框架提高了转换效率,实现了高质量的视频多语言转换。
技术关键词
多语言转换方法
并行处理框架
语音特征提取
分片
Serverless架构
质量检验模块
音频
文本
音视频
并行处理单元
语义分割技术
状态监控系统
视频流
队列管理
视频同步
系统为您推荐了相关专利信息
数据一致性校验
计算机可读取存储介质
远距离
分片
异构
声纹模型
电子设备
计算机程序代码
设备控制方法
声纹特征