一种基于通用动作空间的定制化动作图像生成方法及系统

正文

推荐专利

申请号：CN202411551497

申请日期：2024-11-01

公开号：CN119723230A

公开日期：2025-03-28

类型：发明专利

摘要

本发明公开了一种基于通用动作空间的定制化动作图像生成方法及系统，本发明的方法包括三个关键步骤：首先基于一组具有代表性的动作短语构建通用动作语义空间；其次在通用动作语义空间内模仿定制化动作；最后通过动作相似度损失优化定制化动作的语义相似度，从而在不同情境中生成准确、与上下文无关的定制化动作图像，同时保持了不同主体，包括动物、人类甚至定制化人物的身份一致性。本发明的方法特别适用于文本引导的扩散模型的少样本动作图像合成，其构建一个通用动作语义空间，以解决在少样本图像情况下，将动作与参考动作图像中的人物外观等其他语义特征解耦的挑战。此外，通过实验验证了本发明的方法在生成定制化动作图像方面的优越性。

技术关键词

自定义标识符图像生成方法图像生成模型生成图像数据多层感知器分词文本编码器语义特征特征提取器线性判别分析方法计算机电子设备网络主成分分析方法图像生成系统存储计算机程序超分辨率

系统为您推荐了相关专利信息

基于多模态多尺度特征的超短期光伏功率预测方法及系统

卷积长短期记忆多尺度特征交叉注意力机制长短期记忆神经网络地基云图

一种图像生成方法、装置、设备及存储介质

噪声图像人物特征噪声信息图像生成方法样本

基于正则化约束防止灾难性遗忘的小样本微调方法

微调方法输出特征图像重建样本适配器

三维场景渲染方法、装置、设备及存储介质

着色三维场景渲染方法三维物体表面编码光照

一种基于模糊编码的轨迹表示学习方法

学习方法表达式注意力层级多层感知器网络

一种基于通用动作空间的定制化动作图像生成方法及系统

站点导航

APP 下载