基于智能图像处理的字幕匹配显示方法和系统

AITNT
正文
推荐专利
基于智能图像处理的字幕匹配显示方法和系统
申请号:CN202510076610
申请日期:2025-01-17
公开号:CN119992530B
公开日期:2025-09-02
类型:发明专利
摘要
本发明提供一种基于智能图像处理的字幕匹配显示方法和系统,涉及计算机技术领域,所述方法包括:将待处理视频进行解析,获得视频图像;通过图像信息处理模型,对视频图像进行处理,获得口型信息和表情信息;通过文本识别模型,对音频文件进行处理,确定文本信息;确定音频子文件对应的视频图像;根据音频子文件、口型信息和表情信息,确定文本的像素值;根据音频子文件和表情信息,确定文本的显示尺寸;根据文本的像素值和显示尺寸,获得显示信息,从而获得字幕。根据本发明,可基于口型信息和表情信息来确定字幕的文本信息中的重点,从而对字幕设置特定的像素值和显示尺寸,以突出字幕中的重点文本,便于观看者进行观看和了解,提升显示效果。
技术关键词
匹配显示方法 智能图像处理 信息处理模型 音频 字幕 视频 文本识别模型 样本 显示信息 像素 计算机程序指令 发音特征 匹配显示设备 对象 尺寸 时间段 处理器
系统为您推荐了相关专利信息
1
一种基于Web技术和深度神经网络的计算机辅助面访方法及系统
Web技术 深度神经网络 音频 影像 校验模块
2
弹幕渲染方法、装置及电子设备
舞台灯光 弹幕数据 透明度 弹幕渲染方法 弹幕特效
3
音视频数据的同步方法、装置、计算机设备和存储介质
网络状态评估 音频 数据 粒子滤波器 时间段
4
基于背景补偿与适配器微调的多模态视听事件定位方法
预训练模型 事件定位方法 混合损失函数 背景补偿 适配器
5
投掷动物行为的确定方法、装置、存储介质及电子装置
动物 对象 神经网络模型 运动 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号