摘要
本发明提出一种用于身份保持的个性化视频生成方法及系统,涉及个性化视频生成的技术领域,该方法包括:获取参考图像与文本提示;利用参考图像与文本提示生成联合潜标记,并将参考图像分割重组得到面部标记序列;采用预设的局部路由器将联合潜标记与面部标记序列融合,生成增强潜标记;对增强潜标记进行去噪,得到初步去噪潜标记;将初步去噪潜标记输入时间自回归模块,得到时间增强潜标记;将时间增强潜标记输入解码器,生成个性化视频。该方法通过引入局部路由器与时间自回归模块,有效提升视频生成过程中的身份保持能力与时空一致性。
技术关键词
标记
个性化视频
面部
输入解码器
序列
身份
路由器
图像分割
编码特征
图像编码
线性变换矩阵
文本编码器
随机噪声
生成系统
解码模块
分块
系统为您推荐了相关专利信息
风险预测模型
员工
数据
计算机执行指令
风险预测方法
图像
定制方法
融合特征
语义特征
计算机可读指令
新能源场站
模式识别方法
时间序列特征
动态稳定控制
波动特征
评估预警方法
机器学习模型
高风险
风险评估模型
变量
风速功率曲线
风力发电机组故障
预警方法
序列
故障监控预警系统