基于三维场景与语言数据联合的数据增强方法、装置及系统

正文

推荐专利

申请号：CN202510751059

申请日期：2025-06-06

公开号：CN120671074A

公开日期：2025-09-19

类型：发明专利

摘要

本申请提供了一种基于三维场景与语言数据联合的数据增强方法、装置及系统，方法包括：获取3D场景数据以及对应的文本标注数据；分别对场景数据和文本标注数据进行预处理，得到预处理后的3D‑语言联合数据；对预处理后的3D‑语言联合数据依次进行多模态数据增强，语义质量过滤处理，得到目标3D‑语言联合数据集。本申请通过整合3D点云数据、RGB‑D图像、问答对和密集描述等多种数据源，利用数据预处理、多模态数据增强和语义质量过滤，实现高质量大规模数据集的自动构建，能够在提高3D场景理解和视觉问答任务的数据质量的同时，增强数据的多样性和泛化能力，为3D视觉理解、机器人任务规划等应用提供有力支持。

技术关键词

文本三维点云数据计算机可执行指令场景多模态编码特征语法结构融合特征自然语言语义图像同义词交互特征嵌入特征视觉预训练语言模型 3D点云数据处理器可读存储介质

系统为您推荐了相关专利信息

知识增强的产品问答社区用户对话情绪识别方法和系统

多模态对话情感词典情绪识别方法关键词文本

一种基于NLP与规则融合的区块链监管方法及系统

智能检测节点区块链监管 NLP技术决策拼音

生成视频的方法、装置、设备、存储介质及程序产品

视频主题规划计算机程序产品风格

一种适用于非结构化环境下地面无人车辆的地形可通过性评估方法及系统

多模态特征性评估方法激光雷达点云数据高程地图数据采集设备

一种水下场景神经隐式三维重建方法

水下场景三维重建方法三维重建模型水下光学图像颜色

基于三维场景与语言数据联合的数据增强方法、装置及系统

站点导航

APP 下载