多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置

正文

推荐专利

申请号：CN202411857631

申请日期：2024-12-17

公开号：CN119314230B

公开日期：2025-03-28

类型：发明专利

摘要

本发明公开了一种多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置，其方法包括：通过对与人体骨架序列对应的RGB视频进行采样得到关键帧，经多模态大模型生成动作文本描述；后将人体骨架序列与对应动作文本描述进行编码到公共空间，通过异常样本与信息熵联合估计的样本噪音评估方法生成更可靠的学习目标，使用噪音感知的对比学习方法对模型进行训练；最后，在经过一定批次的迭代训练后可得到性能更优的编码器。本发明在没有额外训练推理成本的前提下，利用编码器本身的能力来区分与动作无关的文本描述，使得模型学习到更加合理的相似性表示，同时较好地提高了编码器在下游任务的性能。

技术关键词

人体骨架序列学习方法无监督信息熵多模态样本关键帧噪声关节点文本编码器训练人体生成动作学习装置处理器视频

系统为您推荐了相关专利信息

一种基于针对语音生成式大模型的对抗样本构建方法及系统

跨模态指令样本搜索算法大语言模型

一种基于PBC患者医疗数据的疲劳评估方法及系统

患者医疗数据疲劳评估方法生物标志物血清疲劳评估系统

一种疾病预测方法、模型、设备及存储介质

疾病预测方法实验室测试数据人口统计数据互补特征异构

一种半球谐振陀螺全角模式启动优化控制方法

半球谐振陀螺优化控制方法双闭环控制策略卡尔曼滤波器优化控制策略

一种智能烧伤创面动态监测与评估系统

评估系统动态注意力烧伤创面治疗多模态特征融合

多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置

站点导航

APP 下载