一种多模态人员穿戴状态自适应检测方法及装置

AITNT
正文
推荐专利
一种多模态人员穿戴状态自适应检测方法及装置
申请号:CN202411501476
申请日期:2024-10-25
公开号:CN119445480A
公开日期:2025-02-14
类型:发明专利
摘要
本发明公开了一种多模态人员穿戴状态自适应检测方法及装置,方法包括步骤:获取目标对象的图像;从数据库中调取预先存储的参考对象图像和对应的文字描述;使用多模态CLIP模型对所述目标对象的图像、参考对象图像和对应的文字描述进行处理,得到目标图像特征向量、参考图像特征向量、参考文字向量;分别计算目标图像特征向量与文字向量之间的相似度、参考图像特征向量与文字向量之间的相似度;比较两种相似度的大小,根据比较结果判断是否处于预定的穿戴状态。本发明结合了图像和文本的多模态信息,基于微调后的CLIP模型进行图像和文字数据处理,提升了识别任务的理解能力和准确性,具有较高的泛化能力和部署效率。
技术关键词
图像特征向量 对象 三元组损失函数 多模态 图像获取模块 更新模型参数 文本 样本 计算方法 梯度下降法 相机拍照 神经网络模型 动态 数据 机制 照片 输出模块 锚点
系统为您推荐了相关专利信息
1
一种智能网卡和基于智能网卡的分布式对象访问方法
预取模块 智能网卡 节点 队列 分布式对象
2
一种基于AI模型的服装设计三维模型可视化展示方法
三维模型可视化 展示方法 尺寸 偏差 对象
3
一种快速门伺服控制方法及伺服控制系统
伺服控制方法 快速门 切换控制策略 传感器冗余 伺服控制系统
4
一种基于多模态分析的软件测试方法及终端
画面 多模态 图像分割模型 软件测试方法 待测软件
5
标定方法、标定系统、计算机设备、存储介质
矩阵 粒子群算法 坐标系 标定系统 视觉标定方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号