多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置

AITNT
正文
推荐专利
多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置
申请号:CN202411857631
申请日期:2024-12-17
公开号:CN119314230B
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了一种多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置,其方法包括:通过对与人体骨架序列对应的RGB视频进行采样得到关键帧,经多模态大模型生成动作文本描述;后将人体骨架序列与对应动作文本描述进行编码到公共空间,通过异常样本与信息熵联合估计的样本噪音评估方法生成更可靠的学习目标,使用噪音感知的对比学习方法对模型进行训练;最后,在经过一定批次的迭代训练后可得到性能更优的编码器。本发明在没有额外训练推理成本的前提下,利用编码器本身的能力来区分与动作无关的文本描述,使得模型学习到更加合理的相似性表示,同时较好地提高了编码器在下游任务的性能。
技术关键词
人体骨架序列 学习方法 无监督 信息熵 多模态 样本 关键帧 噪声 关节点 文本编码器 训练人体 生成动作 学习装置 处理器 视频
系统为您推荐了相关专利信息
1
一种基于针对语音生成式大模型的对抗样本构建方法及系统
跨模态 指令 样本 搜索算法 大语言模型
2
一种基于PBC患者医疗数据的疲劳评估方法及系统
患者医疗数据 疲劳评估方法 生物标志物 血清 疲劳评估系统
3
一种疾病预测方法、模型、设备及存储介质
疾病预测方法 实验室测试数据 人口统计数据 互补特征 异构
4
一种半球谐振陀螺全角模式启动优化控制方法
半球谐振陀螺 优化控制方法 双闭环控制策略 卡尔曼滤波器 优化控制策略
5
一种智能烧伤创面动态监测与评估系统
评估系统 动态 注意力 烧伤创面治疗 多模态特征融合
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号