一种基于大语言模型实现视频重构智能体的方法

正文

推荐专利

申请号：CN202411133993

申请日期：2024-08-19

公开号：CN119182936A

公开日期：2024-12-24

类型：发明专利

摘要

本发明提供了一种基于大语言模型实现视频重构智能体的方法，包括以下步骤：S1.将视频上传到平台，并填写视频重构制作的要求；S2.对视频进行分析处理；S3.根据口播稿内容和视频重构制作的要求判断是否需要智能配音；S4.跨模态镜头匹配，将文本分析所得到的口播稿内容进行向量化，并使用这些文字内容向量到向量数据库进行镜头向量匹配，匹配到的镜头向量即视频重构所需的原材料；S5.根据视频重构所需的原材料和音频文件并结合事先预置的包装模板，生成视频合成脚本；S6.合成服务器根据视频合成脚本将视频合成，形成作品；通过智能化的手段，对已有的视频内容进行自动重构，在符合视频质量和内容要求的同时，极大限度的提高视频修改与制作的效率。

技术关键词

重构智能大语言模型视频包装模板镜头脚本跨模态文本识别服务器语音字幕平台观点样式图像参数

系统为您推荐了相关专利信息

图片检索方法及电子设备

标签图片检索方法关系型数据库大语言模型指令

基于链式推理与程序推理融合的解题方法及系统

解题方法程序答案大语言模型注意力机制

基于多维度的高原病科研学习路径个性化系统

个性化系统访问权限管理病历科研模块

一种日志告警处理方法、系统及电子设备

日志采集单元数据管理模块学习异常检测融合人工智能滑动窗口算法

基于多模态数据处理与动态任务规划的创作方法及系统

创作方法多模态规划图片画像数据库

一种基于大语言模型实现视频重构智能体的方法

站点导航

APP 下载