一种多模态人员穿戴状态自适应检测方法及装置

正文

推荐专利

申请号：CN202411501476

申请日期：2024-10-25

公开号：CN119445480A

公开日期：2025-02-14

类型：发明专利

摘要

本发明公开了一种多模态人员穿戴状态自适应检测方法及装置，方法包括步骤：获取目标对象的图像；从数据库中调取预先存储的参考对象图像和对应的文字描述；使用多模态CLIP模型对所述目标对象的图像、参考对象图像和对应的文字描述进行处理，得到目标图像特征向量、参考图像特征向量、参考文字向量；分别计算目标图像特征向量与文字向量之间的相似度、参考图像特征向量与文字向量之间的相似度；比较两种相似度的大小，根据比较结果判断是否处于预定的穿戴状态。本发明结合了图像和文本的多模态信息，基于微调后的CLIP模型进行图像和文字数据处理，提升了识别任务的理解能力和准确性，具有较高的泛化能力和部署效率。

技术关键词

图像特征向量对象三元组损失函数多模态图像获取模块更新模型参数文本样本计算方法梯度下降法相机拍照神经网络模型动态数据机制照片输出模块锚点

系统为您推荐了相关专利信息

一种智能网卡和基于智能网卡的分布式对象访问方法

预取模块智能网卡节点队列分布式对象

一种基于AI模型的服装设计三维模型可视化展示方法

三维模型可视化展示方法尺寸偏差对象

一种快速门伺服控制方法及伺服控制系统

伺服控制方法快速门切换控制策略传感器冗余伺服控制系统

一种基于多模态分析的软件测试方法及终端

画面多模态图像分割模型软件测试方法待测软件

标定方法、标定系统、计算机设备、存储介质

矩阵粒子群算法坐标系标定系统视觉标定方法

一种多模态人员穿戴状态自适应检测方法及装置

站点导航

APP 下载