摘要
本发明公开了一种多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置,其方法包括:通过对与人体骨架序列对应的RGB视频进行采样得到关键帧,经多模态大模型生成动作文本描述;后将人体骨架序列与对应动作文本描述进行编码到公共空间,通过异常样本与信息熵联合估计的样本噪音评估方法生成更可靠的学习目标,使用噪音感知的对比学习方法对模型进行训练;最后,在经过一定批次的迭代训练后可得到性能更优的编码器。本发明在没有额外训练推理成本的前提下,利用编码器本身的能力来区分与动作无关的文本描述,使得模型学习到更加合理的相似性表示,同时较好地提高了编码器在下游任务的性能。
技术关键词
人体骨架序列
学习方法
无监督
信息熵
多模态
样本
关键帧
噪声
关节点
文本编码器
训练人体
生成动作
学习装置
处理器
视频
系统为您推荐了相关专利信息
患者医疗数据
疲劳评估方法
生物标志物
血清
疲劳评估系统
疾病预测方法
实验室测试数据
人口统计数据
互补特征
异构
半球谐振陀螺
优化控制方法
双闭环控制策略
卡尔曼滤波器
优化控制策略
评估系统
动态
注意力
烧伤创面治疗
多模态特征融合