一种使用多模态模型进行齿轮图像精准识别的方法及系统

正文

推荐专利

申请号：CN202410762047

申请日期：2024-06-13

公开号：CN118537705B

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了一种使用多模态模型进行齿轮图像精准识别的方法及系统，该方法通过融合ResNet和Llama2的多模态Transformer模型实现齿轮图像识别和；所述方法包含以下步骤：S100：数据采集和预处理；从各类开源的零件图库和/或零件标准文件中收集图像数据和文本数据，S200：动态样本对选择策略；S300：建立多模态模型；所述多模态模型包含图像处理分支和文本处理分支；图像处理分支使用ResNet模型进行图像嵌入和模型训练；文本处理分支使用LlaMa2模型获取文本描述的嵌入和深层文本学习；S400：高级融合策略；S500：模型训练和评估；本发明不仅优化了齿轮图像的识别过程，还通过集成到工业自动化系统中，提高了整体的工程效率和数据安全性。

技术关键词

文本多模态样本齿轮分支图像处理图像特征向量数据图像嵌入深层网络结构工业自动化系统融合策略生成图像特征注意力机制零件构建知识图谱三元组

系统为您推荐了相关专利信息

冷冻水供水温度确定方法、装置和电子设备

冷冻站除湿机样本温度预测模型冷冻水系统

基于动量对比学习和元学习的装备传动系统开集故障诊断方法、装置、设备及介质

高维特征向量传动系统预测类别故障诊断方法样本

一种车路协同条件下的道路交通风险等级预测方法

高风险神经网络分类器样本实时数据融合多源数据

一种双块式轨枕的裂缝检测方法和系统

三维重建模型双块式轨枕裂缝检测方法超声波特征金字塔网络

基于多模态数据的历程分析方法和装置

多模态重构图像数据解码器记忆单元节点特征

一种使用多模态模型进行齿轮图像精准识别的方法及系统

站点导航

APP 下载