一种基于通用动作空间的定制化动作图像生成方法及系统

AITNT
正文
推荐专利
一种基于通用动作空间的定制化动作图像生成方法及系统
申请号:CN202411551497
申请日期:2024-11-01
公开号:CN119723230A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了一种基于通用动作空间的定制化动作图像生成方法及系统,本发明的方法包括三个关键步骤:首先基于一组具有代表性的动作短语构建通用动作语义空间;其次在通用动作语义空间内模仿定制化动作;最后通过动作相似度损失优化定制化动作的语义相似度,从而在不同情境中生成准确、与上下文无关的定制化动作图像,同时保持了不同主体,包括动物、人类甚至定制化人物的身份一致性。本发明的方法特别适用于文本引导的扩散模型的少样本动作图像合成,其构建一个通用动作语义空间,以解决在少样本图像情况下,将动作与参考动作图像中的人物外观等其他语义特征解耦的挑战。此外,通过实验验证了本发明的方法在生成定制化动作图像方面的优越性。
技术关键词
自定义标识符 图像生成方法 图像生成模型 生成图像数据 多层感知器 分词 文本编码器 语义特征 特征提取器 线性判别分析方法 计算机电子设备 网络 主成分分析方法 图像生成系统 存储计算机程序 超分辨率
系统为您推荐了相关专利信息
1
基于多模态多尺度特征的超短期光伏功率预测方法及系统
卷积长短期记忆 多尺度特征 交叉注意力机制 长短期记忆神经网络 地基云图
2
一种图像生成方法、装置、设备及存储介质
噪声图像 人物特征 噪声信息 图像生成方法 样本
3
基于正则化约束防止灾难性遗忘的小样本微调方法
微调方法 输出特征 图像重建 样本 适配器
4
三维场景渲染方法、装置、设备及存储介质
着色 三维场景渲染方法 三维物体表面 编码 光照
5
一种基于模糊编码的轨迹表示学习方法
学习方法 表达式 注意力 层级 多层感知器网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号