摘要
本公开涉及一种视频处理方法、装置、电子设备、存储介质和程序产品,涉及计算机技术领域。本公开的视频处理方法,包括:识别视频中的文本区域,并确定文本区域中的第一文本以及第一文本对应的像素;去除第一文本对应的像素,并对第一文本对应的背景像素进行修复;将基于第一文本翻译得到的第二文本添加至文本区域;将视频中第一文本对应的第一音频,替换为基于第二文本生成的第二音频,其中,第二音频与第一音频中相同角色的声音特征保持一致。
技术关键词
文本
语音
视频
音频
机器学习模型
字幕
声纹特征
图像
像素
人声
掩码矩阵
处理器
光学字符识别
电子设备
计算机程序产品
指令
识别模块
可读存储介质
关系
系统为您推荐了相关专利信息
新能源汽车充电桩
新能源规划
充电桩数量
协同规划方法
访问特征