摘要
本发明公开了一种详细三维指向性目标分割方法,包括以下步骤:S1、定义任务形式以及定义任务的评价指标;S2、结合人工和大模型对ScanRefer数据集进行修改和增强,以生成DetailRefer数据集;S3、构建DetailBase基线模型,通过DetailBase基线模型对句子级别或短语级别的语言进行分割;该方法通过定义任务形式、生成DetailRefer数据集以及构建DetailBase基线模型,可增强在3D视觉和语言任务中理解和定位文本上下文的能力。
技术关键词
分割方法
文本
前馈神经网络
基线
场景
多模态信息融合
解码器
理解自然语言
定义
注意力
数据
索引
对象
指标
多层感知机
视觉特征
点云
无监督
坐标
系统为您推荐了相关专利信息
三维实景模型
边坡
病害检测方法
三维建模软件
标记工具
人格评估方法
音频特征
模态特征
多模态
图像编码
情绪识别方法
音乐
卷积模块
带通滤波器
多模态脑
文本编码器
命名实体识别方法
预训练模型
视觉特征
解码矩阵