基于视觉大模型的物体识别方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411531248

申请日期：2024-10-30

公开号：CN119399420A

公开日期：2025-02-07

类型：发明专利

摘要

本发明涉及人工智能技术领域及医疗健康领域，公开了基于视觉大模型的物体识别方法、装置、设备及存储介质，通过获取待识别的目标物体的物体图像，并利用图像采集设备实时采集包含有所述目标物体的目标图像；采用图像分割算法提取所述目标图像中所有物体的物体图像；将各所述物体的物体图像按照预设指令排列，形成初始图像格栅；对所述初始图像格栅中各所述物体的物体图像的位置和大小进行调整，以保证任意两相邻所述物体的物体图像不重叠、且其中心点的连线长度相等，得到目标图像格栅；将所述目标图像格栅与所述目标物体的物体图像一同输入视觉大模型，生成所述目标图像中所述目标物体的识别结果；可有效提升物体识别准确性、鲁棒性及可扩展性。

技术关键词

物体识别方法图像分割算法图像采集设备视觉格栅图像内容特征物体识别装置连线可读存储介质人工智能技术指令医疗健康处理器画布图像增强计算机设备模块存储器

系统为您推荐了相关专利信息

基于空间注意力的目标检测方法、装置及自动驾驶车辆

注意力雷达点云空间模态特征密度

一种行为识别方法和装置

视觉特征运动特征语义特征人体骨骼交互特征

盲文信息展示系统、盲文信息展示装置

电触觉设备柔性电极阵列盲文信息多路选通电路串口通信模块

一种基于红外热成像的穿墙套管表面污秽不均匀度的智能检测方法

穿墙套管智能检测方法污秽图像分割算法成像

基于多模态深度分布监督的高效3D高斯场景重建方法

场景重建方法坐标系相机透明度深度分布图

基于视觉大模型的物体识别方法、装置、设备及存储介质

站点导航

APP 下载