摘要
本发明公开了一种基于通用动作空间的定制化动作图像生成方法及系统,本发明的方法包括三个关键步骤:首先基于一组具有代表性的动作短语构建通用动作语义空间;其次在通用动作语义空间内模仿定制化动作;最后通过动作相似度损失优化定制化动作的语义相似度,从而在不同情境中生成准确、与上下文无关的定制化动作图像,同时保持了不同主体,包括动物、人类甚至定制化人物的身份一致性。本发明的方法特别适用于文本引导的扩散模型的少样本动作图像合成,其构建一个通用动作语义空间,以解决在少样本图像情况下,将动作与参考动作图像中的人物外观等其他语义特征解耦的挑战。此外,通过实验验证了本发明的方法在生成定制化动作图像方面的优越性。
技术关键词
自定义标识符
图像生成方法
图像生成模型
生成图像数据
多层感知器
分词
文本编码器
语义特征
特征提取器
线性判别分析方法
计算机电子设备
网络
主成分分析方法
图像生成系统
存储计算机程序
超分辨率
系统为您推荐了相关专利信息
卷积长短期记忆
多尺度特征
交叉注意力机制
长短期记忆神经网络
地基云图