一种对比语义查询的多模态装配动作识别方法

AITNT
正文
推荐专利
一种对比语义查询的多模态装配动作识别方法
申请号:CN202511527464
申请日期:2025-10-24
公开号:CN120997911A
公开日期:2025-11-21
类型:发明专利
摘要
本申请公开了一种对比语义查询的多模态装配动作识别方法,涉及人机协作装配技术领域,该方法包括:通过在装配工作台布设视觉传感器获取操作员动作视频,经随机帧采样得到采样帧序列、人体姿态估计得到骨骼序列,输入装配动作识别模型完成识别。该模型含图像编码、骨骼编码、特征融合、文本编码及语义对比模块,分别提取图像与骨骼特征、融合特征、编码预设类别文本描述、对比动作特征与类别文本特征并输出相似度最高结果,训练时采用对比损失函数。此方法融合多模态信息,解决单一模态局限与多模态语义割裂问题,充分利用类别文本语义,提升细粒度动作识别精度,降低过拟合风险,增强模型在动态工业场景的泛化与任务迁移能力。
技术关键词
动作识别方法 动作识别模型 文本 编码模块 语义 人体骨骼 人体姿态估计 骨骼特征 视频 动作特征 数据 序列 图像编码 装配工作台 注意力 样本 融合多模态信息 视觉传感器 适配器 前馈神经网络
系统为您推荐了相关专利信息
1
面向养老的AI多技术融合智能对话模型构建方法及系统
智能对话模型 动态语义特征 意图识别模型 意图类别 转移概率矩阵
2
一种用于穿刺机器人的规划及导航方法和系统
双通道卷积神经网络 全局路径规划 穿刺机器人 三维模型 导航方法
3
一种基于向量数据库的高频输入问题实时统计方法及系统
文本 编码向量 统计方法 语义 排序模型
4
一种稀疏梯度增强的边缘保持图像平滑方法
图像平滑方法 梯度方法 加权方法 纹理 滤波
5
基于检索增强生成的广告合规性检测方法及装置
合规性检测方法 广告 特征提取模块 多模态特征融合 视频特征提取
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号