基于文本和镜头相似的自动化视频剪辑方法、装置及终端

正文

推荐专利

申请号：CN202510709855

申请日期：2025-05-29

公开号：CN120499445A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了基于文本和镜头相似的自动化视频剪辑方法、装置及终端，属于人工智能技术领域。该方法包括：基于对指定音乐的音乐区间识别结果，确定混剪视频的结束时间；挑选主体标签为风景的镜头作为片头镜头；并基于主体识别结果、行为识别结果和运动计算结果，与其他镜头进行相似度分析，并基于深度学习模型计算镜头间的视觉相似度，识别重复或冗余画面，挑选高能镜头作为片中高燃镜头；并基于挑选的结束词的对应片段，检索并截取对应镜头作为片尾镜头；将所述指定音乐、及片头、片中高燃镜头和片尾镜头进行音视频混剪组装。本发明通过融合多模态特征分析与智能剪辑逻辑生成，实现高效、高质量的视频自动化生产。

技术关键词

镜头视频剪辑方法音乐节奏识别自动语音识别技术深度学习模型文本语义结构大语言模型音视频分片标签字幕视频剪辑装置画面运动冗余主题视觉

系统为您推荐了相关专利信息

芯片缺陷多面检测装置

直角棱镜面光源分光棱镜远心镜头显示机构

基于模板范本的招标文件生成方法、系统及存储介质

文件生成方法深度学习模型字段模板关键字

一种基于记忆向量深度生成网络的射频指纹识别方法

深度生成网络射频指纹识别方法记忆射频指纹提取深度生成模型

大规模不完全多视图、多模态场景下图像库构建和识别方法

坐标系图像库识别方法传感器多模态

融合图像处理与深度学习的员工行为安全预警系统及其方法

融合图像处理钢筋切断机双目视觉系统预警方法手部关键点

基于文本和镜头相似的自动化视频剪辑方法、装置及终端

站点导航

APP 下载