一种轻量化的文本生成视频方法和装置

正文

推荐专利

一种轻量化的文本生成视频方法和装置

申请号：CN202510016660

申请日期：2025-01-06

公开号：CN119893237A

公开日期：2025-04-25

类型：发明专利

摘要

本发明公开了一种轻量化的文本生成视频方法和装置，该方法结合了提示词学习和时序感知的DDIM反演技术，通过引入共享提示词令牌以提高编辑灵活性，同时通过非共享的帧特定令牌来强化跨帧一致性，同时，采用双边滤波的时序感知的DDIM反演进一步优化了视频帧之间的连贯性，以最低的训练成本提升基于扩散算法的文本生成图像视频编辑性能。本方法在无需进行额外训练的情况下，提高文本生成视频生成框架中的时序一致性、语义对齐、帧间一致性以及视频质量。

技术关键词

令牌时序视频装置适配器滤波器模块文本生成图像像素语义强度随机噪声参数度函数序列扩散算法

系统为您推荐了相关专利信息

一种基于时序生成对抗网络的新能源配电网动态监测系统、方法及存储介质

新能源配电网动态监测方法生成对抗网络模型静态特征动态监测系统

血管介入手术目标定位方法、装置、介质及设备

图像特征向量文本特征向量血管介入手术文本编码器图像编码器

星载多源点轨迹融合起批系统

Kalman滤波器轨迹关联方法交换模块载荷动态可调

一种视频上传验证方法、装置、设备及其存储介质

人脸检测模型视频验证方法计算机可读指令分类网络

一种基于人工智能的机场跑道入侵风险评估方法及系统

机场跑道监测设备风险评估方法风险评估系统天气

一种轻量化的文本生成视频方法和装置

站点导航

APP 下载