基于智能图像处理的字幕匹配显示方法和系统

正文

推荐专利

申请号：CN202510076610

申请日期：2025-01-17

公开号：CN119992530B

公开日期：2025-09-02

类型：发明专利

摘要

本发明提供一种基于智能图像处理的字幕匹配显示方法和系统，涉及计算机技术领域，所述方法包括：将待处理视频进行解析，获得视频图像；通过图像信息处理模型，对视频图像进行处理，获得口型信息和表情信息；通过文本识别模型，对音频文件进行处理，确定文本信息；确定音频子文件对应的视频图像；根据音频子文件、口型信息和表情信息，确定文本的像素值；根据音频子文件和表情信息，确定文本的显示尺寸；根据文本的像素值和显示尺寸，获得显示信息，从而获得字幕。根据本发明，可基于口型信息和表情信息来确定字幕的文本信息中的重点，从而对字幕设置特定的像素值和显示尺寸，以突出字幕中的重点文本，便于观看者进行观看和了解，提升显示效果。

技术关键词

匹配显示方法智能图像处理信息处理模型音频字幕视频文本识别模型样本显示信息像素计算机程序指令发音特征匹配显示设备对象尺寸时间段处理器

系统为您推荐了相关专利信息

一种基于Web技术和深度神经网络的计算机辅助面访方法及系统

Web技术深度神经网络音频影像校验模块

弹幕渲染方法、装置及电子设备

舞台灯光弹幕数据透明度弹幕渲染方法弹幕特效

音视频数据的同步方法、装置、计算机设备和存储介质

网络状态评估音频数据粒子滤波器时间段

基于背景补偿与适配器微调的多模态视听事件定位方法

预训练模型事件定位方法混合损失函数背景补偿适配器

投掷动物行为的确定方法、装置、存储介质及电子装置

动物对象神经网络模型运动数据

基于智能图像处理的字幕匹配显示方法和系统

站点导航

APP 下载