摘要
本申请公开了一种视频拍摄实时成片方法及装置,方法包括:按照预设时长动态获取实时拍摄的多个视频帧,并识别多个视频帧得到多个标签信息;获取提示词输入信息以及场景信息,并与多个标签信息生成多个提示词;根据多个提示词,利用预设大语言模型按照预设时长生成对应的多个文案信息,以及基于预设素材库确定目标素材;将文案信息和目标素材依次铺设至视频中,得到渲染后的视频。根据实时拍摄的视频,识别视频帧确定标签信息,结合场景信息、提示词输入信息,实时调用预设大语言模型动态生成贴合视频的文案信息,推荐目标素材以渲染视频,帮助用户制作完善视频。
技术关键词
大语言模型
视频帧
视频流
生成提示词
字幕模板
场景
情感识别模型
语音
通信接口
动态
处理器
计算机存储介质
标签模块
指令
计算机程序产品
滤镜
存储器
输入接口
系统为您推荐了相关专利信息
AR设备
生成管道
实时图像
规则化三维模型
深度传感器