摘要
本发明提供了一种基于大语言模型实现视频重构智能体的方法,包括以下步骤:S1.将视频上传到平台,并填写视频重构制作的要求;S2.对视频进行分析处理;S3.根据口播稿内容和视频重构制作的要求判断是否需要智能配音;S4.跨模态镜头匹配,将文本分析所得到的口播稿内容进行向量化,并使用这些文字内容向量到向量数据库进行镜头向量匹配,匹配到的镜头向量即视频重构所需的原材料;S5.根据视频重构所需的原材料和音频文件并结合事先预置的包装模板,生成视频合成脚本;S6.合成服务器根据视频合成脚本将视频合成,形成作品;通过智能化的手段,对已有的视频内容进行自动重构,在符合视频质量和内容要求的同时,极大限度的提高视频修改与制作的效率。
技术关键词
重构智能
大语言模型
视频
包装模板
镜头
脚本
跨模态
文本识别
服务器
语音
字幕
平台
观点
样式
图像
参数
系统为您推荐了相关专利信息
标签
图片检索方法
关系型数据库
大语言模型
指令
日志采集单元
数据管理模块
学习异常检测
融合人工智能
滑动窗口算法