基于空时Transformer的多模态人体姿态估计模型训练方法

正文

推荐专利

申请号：CN202510463984

申请日期：2025-04-14

公开号：CN120387028A

公开日期：2025-07-29

类型：发明专利

摘要

本发明属于姿态捕捉技术领域，提供基于空时Transformer的多模态人体姿态估计模型训练方法，包括：多模态人体姿态估计网络包括浅层空时Transformer级联网络、深层空时Transformer级联网络；获取样本对集；基于样本对集对文本特征提取网络和多模态人体姿态估计网络进行迭代训练，对浅层空时Transformer级联网络获得的全局姿态特征和文本特征提取网络获得的全局文本特征进行对比学习，基于对比损失优化浅层空时Transformer级联网络和文本特征提取网络的网络参数，基于关节位置误差优化视觉投影层、深层空时Transformer级联网络和姿态输出层的网络参数；本发明还公开了基于空时Transformer的多模态人体姿态估计方法，一种计算机程序产品和一种电子设备，本发明提高了姿态估计准确度。

技术关键词

模型训练方法特征提取网络文本级联姿态特征人体姿态估计方法样本多模态输出特征姿态捕捉技术模块计算机程序产品关节视频帧焦点融合特征电子设备处理器

系统为您推荐了相关专利信息

基于交易公式文本转换的金融交易处理方法及系统

文本策略动态链接库文件内存访问模式生成资源

一种基于多源异构数据的技术规范文本生成方法和系统

多源异构数据文本生成方法解析工具填充工具数据处理工具

主题确定方法、装置及电子设备

语义向量文本多层注意力特征提取模型主题

體感式情境互動系統

情感分析模型文本伺服器模式情趣

一种语义驱动的时间序列预测模型及其训练方法

时间序列预测模型矩阵残差网络编码模块静态特征

基于空时Transformer的多模态人体姿态估计模型训练方法

站点导航

APP 下载