一种基于视觉标识符的视频生成方法

正文

推荐专利

一种基于视觉标识符的视频生成方法

申请号：CN202511038269

申请日期：2025-07-28

公开号：CN120935377A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种基于视觉标识符的视频生成方法，属于视频生成技术领域。该方法包括以下步骤：获取输入的视频数据，提取初始的时空特征；初始化可学习的基向量作为视觉标识符，并将其与初始的时空特征各自进行调制；将调制后的视觉标识符和时空特征拼接形成扩展特征序列并对其进行优化，生成视频帧或视频序列后再与视频数据拼接，形成新的视频数据，不断迭代重复，最终输出高质量的视频序列。本发明通过引入视觉标识符，能够在视频生成过程中有效捕捉和利用视频的全局信息，精确调节时空特征，使得生成的视频在空间和时间维度上具有更好的连贯性和一致性。本发明能够提升视频生成质量，优化时空特征的建模，降低视频生成模型的开发成本。

技术关键词

视觉标识符视频生成方法序列多层感知机注意力机制数据参数计算机电子设备视频生成技术视频生成模型感知损失函数高维特征向量存储计算机程序计算机程序产品处理器可读存储介质存储器解码器

系统为您推荐了相关专利信息

一种基于动态策略切换的多任务自适应学习方法

调度控制器学习方法特征提取网络非线性编码向量

一种技术标评审的自动化匿名混合交叉评估方法

引入注意力机制敏感信息数据 TensorFlow框架参数文本

一种基于多模态同步的数字人智能交互与姿态表情合成方法

时间同步融合特征生成对抗网络架构多模态特征校正算法

一种基于OLT与PLC芯片协同通信的识别方法及系统

设备序列号光线路终端光网络单元协同通信光电复合缆

一种基于空间-区间双分治的机械臂路径规划方法

节点三维空间地图机械臂连杆机械臂末端执行器终点

一种基于视觉标识符的视频生成方法

站点导航

APP 下载