摘要
本申请公开了一种姿态可控生成方法及相关装置,涉及生成式人工智能技术领域,预先对稳定扩散模型训练获得图扩散模型,稳定扩散模型中去噪模型通过插入图卷积神经网络能够处理非欧几里得空间的数据特征(即比较分散的、但具有空间结构的数据特征)。获取待处理的第一自然语言文本,并随机生成第一纯噪声热力图;将所述第一自然语言文本和所述第一纯噪声热力图输入至图扩散模型中;获取所述图扩散模型输出的第一关键点热力图,所述第一关键点热力图与所述第一自然语言文本相匹配;将所述第一关键点热力图转换为第一姿态骨架图。本申请基于图扩散模型能够自然语言描述中生成多样且正确的二维姿态骨架图。
技术关键词
自然语言文本
姿态可控
热力图
关键点
生成方法
去噪模型
计算机可读指令
模型训练模块
电子设备
噪声
交叉注意力机制
生成装置
计算机存储介质
存储计算机程序
人工智能技术
计算机程序产品
空间结构
处理器
通道
系统为您推荐了相关专利信息
网格特征
视觉特征
语义特征
残差归一化
注意力机制
意图识别
文本
问答方法
大语言模型
数据获取模块
攀爬检测方法
轮廓
解码器
深度学习框架
光流模型
员工
可穿戴设备
指令
环境图像数据
虚拟现实头盔