摘要
本发明公开了一种基于大语言模型的智能视频剪辑方法,基于机构资源库素材,通过大语言模型、跨模态引擎、语音识别与合成、视听语言模型等AI人工智能技术与视音频生产相结合,将专业媒体内容生产中的文字稿件通过大语言模型进行处理,把视音频素材通过跨模态引擎和语音识别引擎等进行综合智能分析,通过语义匹配方式分别在跨模态索引库和同期声索引库中进行智能镜头匹配,供编辑人员对智能编辑结果进行人工快速调整与修改。本发明可用于新媒体短视频、事件播报类视频新闻、电视节目二次创作、影视剧片花和集锦等类型节目的智能生产,为各媒体机构和专业内容生产者提供全新的视频生产方式,满足互联网时代,视频推送制下对海量视频内容的生产要求。
技术关键词
视频剪辑方法
大语言模型
关键帧
跨模态
视音频
智能识别视频
索引
视听
综合智能分析
资源库
模式匹配
语音识别引擎
智能镜头
镜头组
场景
连续性
语义
系统为您推荐了相关专利信息
时序动作检测方法
跨模态
视觉特征
文本编码器
图像编码器
文本处理方法
大语言模型
计算机程序产品
对象
分段
大语言模型
语句
自然语言
数据库管理系统
后续数据分析