一种基于大模型的影视剧自动理解，剪辑与解说的方法

正文

推荐专利

申请号：CN202510129913

申请日期：2025-02-05

公开号：CN119967234A

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了一种基于大模型的影视剧自动理解，剪辑与解说的方法，基于音频提取工具和多模态模型，获取待进行解说的视频中的完整音频，以获取具有说话人的音频片段的时间戳，进而获取待进行解说的视频的剧本描述，以获取待进行解说的视频的剧情摘要；基于文本嵌入模型和图文特征提取模型，获取与所述逐句的画面描述对应的视频片段；最后基于语音文字转换模型获取所述逐句的画面描述的语音配音，获取完整的视频解说，完成对待进行解说的视频的理解，剪辑与解说。本发明显著减少了人工干预，提高了视频解说剪辑的处理效率，降低了人力成本。通过自动生成剧本描述、剧情摘要和解说，使得用户能够更快速、更便捷地获取视频的核心内容，增强了用户体验。

技术关键词

视频影视剧画面特征提取模型音频字幕文本特征向量图文镜头分割算法场景摘要方法语音深度学习模型大语言模型语义索引多模态标识

系统为您推荐了相关专利信息

基于半监督分割的工业流程智能检测方法与装置

智能检测方法运动轨迹数据图像分割关键点轻量级神经网络

一种基于跨模态时空联合学习的多模态视频目标识别方法

跨模态识别方法融合特征视频视觉特征提取

视频合成方法、装置、电子设备以及程序产品

人体视频矩阵信号源三次样条插值

一种水下悬浮传输平台

功能模块全景视频系统虚拟现实视频横向推进器控制视频系统

基于目标识别与定位的鸟声定向采集方法、装置及存储介质

定向采集方法录音设备云台相机数据

一种基于大模型的影视剧自动理解，剪辑与解说的方法

站点导航

APP 下载