摘要
本公开的实施例提供了用于视频生成的方法、装置、设备、存储介质和程序产品。该方法包括:获取针对目标对象的多个视频片段和目标对象的对象信息,多个视频片段分别具有对应的第一标识信息;利用经训练的机器学习模型,基于多个视频片段和提示词生成目标文件,提示词至少包括对象信息和多个视频片段各自的第一标识信息,并且目标文件至少包括与多个视频片段中的按顺序排列的至少一个视频片段对应的第一标识信息、对至少一个视频片段的文本描述以及对文本描述的分割结果;以及至少基于目标文件,生成针对目标对象的目标视频。
技术关键词
文本
对象
机器学习模型
音频
标识
处理单元
字符
计算机程序产品
可读存储介质
视频帧
存储器
处理器
电子设备
模块
指令
格式
语音
系统为您推荐了相关专利信息
密钥管理方法
机器人
接收方
发送方
拉格朗日插值
场景文本识别方法
注意力
浅层特征提取
编码模块
缩放模块
数据分析方法
关键词
智能机器人
图像数据集合
项目