摘要
本发明涉及点云全景分割领域,提供了一种基于多模态大模型的点云全景分割方法、系统及设备。该方法包括获取点云数据和描述点云场景的文本;基于文本数据,采用文本编码器,得到文本嵌入特征;基于描述点云场景的文本,采用点云编码器,得到点云嵌入特征;将文本嵌入特征和点云嵌入特征输入至多模态理解适配器中,得到文本特征和点云特征;将文本特征和点云特征融合,得到融合特征;在多模态大模型中每间隔设定个的隐藏层引入融合特征进行多模态融合,得到全景特征;将全景特征输入至解码器中,得到全景分割结果。本发明结合图像、文本等模态的信息可以帮助算法更准确地识别点云中的不同全景,并减少误分割和漏分割的情况。
技术关键词
记忆
全景分割方法
嵌入特征
多模态
融合历史
注意力
融合特征
点云
适配器
矩阵
分割系统
文本编码器
视频帧特征
冗余
解码器
线性
压缩算法
聚类算法
损失函数优化
系统为您推荐了相关专利信息
多模态
执行设备
无人机影像数据
人工智能模型
农业数据采集
玩偶系统
偏好特征
序列
生成执行指令
情感状态识别
智能分析模型
投诉工单数据
主题
智能分析模块
Word2Vec模型
电力日负荷
长短期记忆网络
生成预测模型
指标
电力系统负荷预测技术
突发事件预警方法
多模型协同
气体浓度传感器
多模态环境
停车场