基于视觉大模型的物体识别方法、装置、设备及存储介质

AITNT
正文
推荐专利
基于视觉大模型的物体识别方法、装置、设备及存储介质
申请号:CN202411531248
申请日期:2024-10-30
公开号:CN119399420A
公开日期:2025-02-07
类型:发明专利
摘要
本发明涉及人工智能技术领域及医疗健康领域,公开了基于视觉大模型的物体识别方法、装置、设备及存储介质,通过获取待识别的目标物体的物体图像,并利用图像采集设备实时采集包含有所述目标物体的目标图像;采用图像分割算法提取所述目标图像中所有物体的物体图像;将各所述物体的物体图像按照预设指令排列,形成初始图像格栅;对所述初始图像格栅中各所述物体的物体图像的位置和大小进行调整,以保证任意两相邻所述物体的物体图像不重叠、且其中心点的连线长度相等,得到目标图像格栅;将所述目标图像格栅与所述目标物体的物体图像一同输入视觉大模型,生成所述目标图像中所述目标物体的识别结果;可有效提升物体识别准确性、鲁棒性及可扩展性。
技术关键词
物体识别方法 图像分割算法 图像采集设备 视觉 格栅 图像内容特征 物体识别装置 连线 可读存储介质 人工智能技术 指令 医疗健康 处理器 画布 图像增强 计算机设备 模块 存储器
系统为您推荐了相关专利信息
1
基于空间注意力的目标检测方法、装置及自动驾驶车辆
注意力 雷达 点云空间 模态特征 密度
2
一种行为识别方法和装置
视觉特征 运动特征 语义特征 人体骨骼 交互特征
3
盲文信息展示系统、盲文信息展示装置
电触觉设备 柔性电极阵列 盲文信息 多路选通电路 串口通信模块
4
一种基于红外热成像的穿墙套管表面污秽不均匀度的智能检测方法
穿墙套管 智能检测方法 污秽 图像分割算法 成像
5
基于多模态深度分布监督的高效3D高斯场景重建方法
场景重建方法 坐标系 相机 透明度 深度分布图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号