摘要
本发明公开了一种文本对齐的人体运动生成方法及系统,属于计算机视觉和深度学习技术领域。本发明采用两阶段训练方式,第一阶段先训练重建人体运动的量化变分自编码器模型,再将量化变分自编码器模型中的解码器网络、经过预训练的文本到运动跨模态检索模型进行参数冻结后,与双向掩码Transformer模型组成训练框架进行训练,训练完毕后用于进行推理任务。本发明通过改进文本编码器、增添语义对齐损失以及采用双向掩码式Transformer架构,加强了整体的运动感知能力和生成运动的语义对齐,使得生成的人体运动序列更加符合原始数据分布,与输入的运动描述文本更具语义一致性,提高了运动生成质量。
技术关键词
运动生成方法
序列
重建人体
标记
文本编码器
运动编码器
运动向量
码字
网络
输入解码器
运动生成系统
计算机电子设备
跨模态
语义
组合模块
系统为您推荐了相关专利信息
多任务
药物推荐方法
电子病历数据
医疗标签
深度卷积神经网络模型
在线监测方法
可见光波段
特征值
指标
多光谱检测技术
多源异构数据融合
风控方法
交互模型
标记特征
训练集
琼脂糖凝胶电泳
液相
芯片
荧光定量仪
基因组文库构建