一种实例级运动可控的视频生成方法、系统、介质及设备

AITNT
正文
推荐专利
一种实例级运动可控的视频生成方法、系统、介质及设备
申请号:CN202510206227
申请日期:2025-02-25
公开号:CN120075549A
公开日期:2025-05-30
类型:发明专利
摘要
本公开提供一种实例级运动可控的视频生成方法、系统、介质及设备,其中,方法包括:获取实例运动控制条件,实例运动控制条件包括实例布局信息和实例运动轨迹;对实例布局信息沿实例运动轨迹进行增广,确定经过增广的实例布局信息;将经过增广的实例布局信息输入引入帧间互注意力机制的预训练的定位图像扩散生成模型,生成候选关键帧;将候选关键帧输入引入帧间互注意力机制的预训练的视频扩散生成模型,确定第一运动视频;根据预训练的视频扩散生成模型的运动先验和预训练的图像扩散生成模型的细节先验对第一运动视频进行优化处理,确定目标运动视频。通过本公开,提高视频生成的运动控制能力,提高视频生成质量,实现实例级运动定制化视频生成。
技术关键词
注意力机制 关键帧 布局 运动可控 视频生成方法 图像嵌入 纹理 非临时性计算机可读存储介质 无噪声 令牌 视频生成系统 轨迹 边缘检测算法 端点 模块 网络
系统为您推荐了相关专利信息
1
一种基于双极化天气雷达的大尺度生物迁飞预测方法
双极化天气雷达 时空卷积神经网络 生物 XGBoost算法 雷达回波图像
2
卡片生成方法、装置、计算机设备、存储介质及产品
卡片生成方法 布局 界面 计算机设备 卡片生成装置
3
一种基于人工智能的土壤电阻率分层预测方法及系统
土壤电阻率 土壤特征 注意力机制 分层 训练样本集
4
一种用于绿电的数据智能处理方法及系统
生成预测模型 发电量 强化学习算法 多源特征 深度Q网络
5
基于语义解耦的新姿态与新视角人体图像渲染方法
语义标签 顶点 网格模型 图像渲染方法 相机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号