摘要
本发明提供一种基于智能图像处理的字幕匹配显示方法和系统,涉及计算机技术领域,所述方法包括:将待处理视频进行解析,获得视频图像;通过图像信息处理模型,对视频图像进行处理,获得口型信息和表情信息;通过文本识别模型,对音频文件进行处理,确定文本信息;确定音频子文件对应的视频图像;根据音频子文件、口型信息和表情信息,确定文本的像素值;根据音频子文件和表情信息,确定文本的显示尺寸;根据文本的像素值和显示尺寸,获得显示信息,从而获得字幕。根据本发明,可基于口型信息和表情信息来确定字幕的文本信息中的重点,从而对字幕设置特定的像素值和显示尺寸,以突出字幕中的重点文本,便于观看者进行观看和了解,提升显示效果。
技术关键词
匹配显示方法
智能图像处理
信息处理模型
音频
字幕
视频
文本识别模型
样本
显示信息
像素
计算机程序指令
发音特征
匹配显示设备
对象
尺寸
时间段
处理器
系统为您推荐了相关专利信息
舞台灯光
弹幕数据
透明度
弹幕渲染方法
弹幕特效
预训练模型
事件定位方法
混合损失函数
背景补偿
适配器