一种多模态感知与认知数据集的构建方法和装置

正文

推荐专利

申请号：CN202411960488

申请日期：2024-12-30

公开号：CN119380343A

公开日期：2025-01-28

类型：发明专利

摘要

本发明提供了一种多模态感知与认知数据集的构建方法和装置，获取图像信息，该图像信息包括智能体自身的摄像头实时抓取的画面；根据图像信息构建知识图谱；其中，该知识图谱包括实体信息和实体之间的位置关系；将图像信息切分为不重叠的子区域图像；根据子区域图像和知识图谱进行图像描述，生成描述图像内容的自然语言文本，并根据自然语言文本构建多模态感知与认知数据集，解决了现有技术中多模态数据集标注方法成本高、效率低、准确度低的问题，提升了多模态模型的感知能力以及包含推理、比较、描述的高级认知能力。

技术关键词

自然语言文本构建知识图谱图像多模态三元组实体 K均值聚类算法人工智能模型卷积架构数据微调技术计算机程序产品计算机视觉初始聚类中心模块信息处理样本

系统为您推荐了相关专利信息

一种横向空腔薄膜沉积工艺仿真方法及装置

薄膜沉积工艺位点衬底仿真方法水平集算法

一种基于大数据的病虫害防治信息管理系统

信息管理系统病虫害防治关键词大数据数据采集模块

一种仿人机器人

膜片式夹紧气缸仿人机器人髋关节组件气动人工肌肉头部组件

基于图像识别技术的管式扩压器表面缺陷识别方法及系统

管式扩压器表面缺陷识别方法像素点图像识别技术聚类

一种基于神经网络的电力设备故障检测方法

多通道特征历史故障数据序列三维模型监测电力设备

一种多模态感知与认知数据集的构建方法和装置

站点导航

APP 下载