视频处理方法及装置

正文

推荐专利

视频处理方法及装置

申请号：CN202511054133

申请日期：2025-07-29

公开号：CN120954386A

公开日期：2025-11-14

类型：发明专利

摘要

本说明书实施例提供了视频处理方法及装置，其中，一种视频处理方法包括：在视频文件的音频和视频的基础上，通过对音频进行语音识别处理获得语音文本，并根据视频的字幕文本对语音文本进行校正处理获得校正语音文本，进一步将视频和校正语音文本输入多模态模型进行剧情识别处理获得剧情理解文案，然后对剧情理解文案进行剧情切分，并将获得的分段剧情文案与校正语音文本输入视频解说生成模型进行解说文案生成获得分段解说文案，最终将分段解说文案与视频进行匹配生成解说视频文件，以此从视频文件的音频和视频出发实现视频文件的解说生成。

技术关键词

分段字幕音频匹配计算机可执行指令多模态时间段音频特征视频帧语音识别模型文本校正大语言模型关键词字段语义

系统为您推荐了相关专利信息

一种基于模块化架构的可扩展移动电力系统及组网方法

移动电力系统电源模块电能路由器无线能量传输装置载体模块

一种基于多元数据融合的疾病相似性预测方法及系统

双线性基因嵌入特征多模态特征网络

一种基于轻量化大语言模型的个人健康评价方法

健康评价方法大语言模型微调工具多轮对话单轮

一种基于联邦学习的隐私保护多模态异常检测方法

异常检测方法客户端多模态计算机程序指令特征提取器

一种快速眼动睡眠行为障碍实时监测与调控方法及系统

信号采集器调控方法多模态调控系统蓝牙模块

视频处理方法及装置

站点导航

APP 下载