摘要
本发明涉及视频生成技术领域,公开了一种基于时空自适应调节与信噪比优化的少样本视频生成方法,旨在解决现有文本生成视频技术中依赖大量文本‑视频对数据及训练资源消耗高的问题。该方法首先通过预训练文本到图像模型生成首帧图像,利用时空特征调控模块提取多尺度时空特征并降维;通过特征滚动增强模块对时空特征进行动态偏移、随机翻转和噪声扰动,增强局部特征表达能力;结合动态信噪比加权策略,根据时间步长对损失函数进行自适应调整,加速模型收敛并提升生成质量。本发明在仅需少量视频样本的条件下,生成具有高分辨率、强时序一致性和文本语义对齐的视频序列,训练效率较传统方法得到显著提升。
技术关键词
视频生成方法
动态信噪比
样本
视频生成技术
文本
图像生成模型
设计特征
模块
策略
噪声
视频帧
多尺度
解码器
机制
序列
语义
系统为您推荐了相关专利信息
深度学习模型
代码特征
残差网络
智能合约漏洞
智能合约地址