一种电器拆解过程人员行为识别模型训练及行为识别方法及系统

正文

推荐专利

申请号：CN202411685573

申请日期：2024-11-23

公开号：CN119919993A

公开日期：2025-05-02

类型：发明专利

摘要

本发明提供一种基于大型视觉语言模型的家电拆解过程中的人员行为识别模型训练方法、行为识别方法及系统。包括：获取拆解过程中的视频数据、将视频数据处理成连续帧、拆解过程人员行为定义、使用Gemini大模型辅助人工标注数据、基于LLaMA2‑7B基座模型设计大型视觉语言模型、分两阶段训练大型视觉语言模型、产品拆解过程人员行为识别系统的前后端搭建与实现。本发明能够准确识别8类不同的家电拆解动作，涵盖了多样化的手势和肢体动作。通过利用大型视觉语言模型的高级逻辑推理能力，本发明实现了对复杂工业场景下人员行为的高效识别，具备良好的迁移性，能够广泛应用于各种工业环境。与传统方法相比，本技术在识别精度和适应性方面具有显著优势，为工业自动化和安全管理提供了一种创新的解决方案。

技术关键词

识别模型训练方法视觉特征提取标注方法拆解作业标注管理方法安全帽文本拆解工位标注规则识别方法两阶段图像视频播放进度视频元数据问答对数据识别系统锤子工具

系统为您推荐了相关专利信息

路口结构识别模型训练方法及路口结构识别方法

路口结构图像特征识别识别模型训练方法识别方法关键点

一种楼层位置的定位和标注方法

WiFi设备标注方法虚拟建筑模型热点气压传感器

合同文本的标注方法、装置和设备

标注方法非暂态计算机可读存储介质操作界面处理器标注装置

公式识别及模型训练方法、装置、相关设备及程序产品

解码模块图像特征提取字符识别模型训练方法公式识别方法

一种城市街景信息检索方法

信息检索方法智能搜索系统街景数据神经网络算法街道

一种电器拆解过程人员行为识别模型训练及行为识别方法及系统

站点导航

APP 下载