摘要
本申请实施例提供一种生成视频的方法、装置及存储介质,该方法包括:获取用户的输入信息,输入信息包括图像和用户编辑指令;对图像和用户编辑指令进行意图识别得到图像主体信息、图像静态信息描述及图像动态信息描述;根据图像静态信息描述对所述图像主体信息进行编辑得到结果图像;获取图像动态信息描述的困惑度,根据所述困惑度判断图像动态信息描述生成语句的合理性,如果合理,则对图像动态信息描述的文本生成动态视频;如果不合理,则根据图像动态信息描述中的用户提示文本语义确定动态视频;根据结果图像和动态视频生成目标视频。该方法实现了不同应用场景的多变地址空间信息任务的自动化处理,提高了系统的安全性。
技术关键词
图像主体
动态
生成语句
意图识别
文本
编辑
语义
视频解码数据
注意力
指令
机器可读存储介质
计算机程序产品
处理器
时域特征
模块
列表
图文
系统为您推荐了相关专利信息
资源优化调度系统
智慧农业
动态
植入式传感器
探针
数字孪生模型
施工设备
设备协同作业
作业场景
基坑施工现场
动态神经网络
可见光图像
特征提取网络
计数方法
Sigmoid函数
文本处理方法
计算机执行指令
指标
大语言模型
策略