摘要
本发明涉及视频处理技术领域,公开了一种视频生成与筛选方法、装置、设备及介质,包括:获取文本描述信息与参考图像信息,通过大模型对文本描述信息进行语义解析,得到多模态语义表示;根据多模态语义表示生成提示词集合,对提示词集合与参考图像信息进行建模得到图像序列信息;利用大模型对图像序列信息进行模型匹配,生成优化提示词,通过视频生成模型基于优化提示词生成视频素材;确定视频素材中相邻帧之间的运动平滑度和画面一致性,并将运动平滑度高于第一预设阈值和画面一致性高于第二预设阈值的视频素材确定为目标视频。本申请可应用于金融科技与医疗养老业务程序系统中,能够在保证视频生成效率的同时提升视频的平滑度与一致性。
技术关键词
视频生成模型
多模态
生成提示词
语义
筛选方法
图像
文本
情感特征
运动矢量场
平滑度
主题
画面
业务程序系统
序列
医疗养老
关键帧
可读存储介质
场景类别
系统为您推荐了相关专利信息
姿态估计
物体位置信息
识别特征
关键点
识别方法
终端设备
对象推荐方法
画像
指令
计算机程序产品
情感词库
情感分析系统
情感分析方法
多模态情感识别
智能客服系统