基于视觉语言的图像识别方法、控制器、机器人及介质

正文

推荐专利

申请号：CN202510856503

申请日期：2025-06-24

公开号：CN120726435B

公开日期：2025-12-26

类型：发明专利

摘要

本申请实施例提供了一种基于视觉语言的图像识别方法、控制器、机器人及介质，涉及人工智能技术领域，适用于金融科技领域和医疗健康领域。该方法包括：获取目标使用者的物品使用记录信息；基于物品使用记录信息生成辅助寻物知识图谱；对辅助寻物知识图谱进行图谱编码，得到图谱结构化语义特征；对目标使用者所在的场景采集得到当前场景画面，并对当前场景画面进行视觉编码，得到当前画面特征；对图谱结构化语义特征、和当前画面特征进行注意力融合处理，得到图谱画面联合特征；获取包含目标物品描述信息的寻物自然语言指令，根据寻物自然语言指令和图谱画面联合特征确定物品查找情况。本申请实施例能够提高特定场景下的物品查找的准确性。

技术关键词

图谱自然语言语义特征图像识别方法画面文本节点特征指令场景机器人控制器可读存储介质物品特征人工智能技术医疗健康注意力视觉处理器存储器

系统为您推荐了相关专利信息

一种虚拟现实全景视频播放系统及方法

虚拟现实全景视频播放系统播放控制模块注视点全景视频流

网络故障的定位方法、装置及非易失性存储介质

告警设备网络故障定位故障定位模型历史告警数据图谱

一种基于软硬件协同的算力自动分配的控制系统及方法

复杂度组态软件输入模块分析器逻辑运算功能

多人协作的工程图纸协同编辑方法及系统

协同编辑方法设计特征工程图纸语义特征日志

基于非限定实体、跨阶段的核电经验反馈查找方法及系统

实体查找方法文本计算机可读指令阶段

基于视觉语言的图像识别方法、控制器、机器人及介质

站点导航

APP 下载