摘要
本发明公开了一种具身智能体多模态感知数据动态融合方法、系统及设备,包括:S1.具身智能体在运动过程中实时采集图像数据;S2.使用多模态大模型判断图像数据的点云填充密度,数据采集过程中利用地图算法填充相机画面的3D点云;S3.通过点云数据投影转换,生成激光雷达特征图;S4.进行多模态大模型的特征数据初始化对齐;S5.构建一组多尺度多通道可微分的互信息精细优化方法对特征数据进行处理;S6.执行多模态大模型在线监测与融合自矫正操作;S7.将相机信息投影到激光3D点云,在具身智能体的运动过程中持续构建融合后的RGB‑3D场景。本发明能够实现激光雷达与相机之间外参的精准、鲁棒、自动标定和融合。
技术关键词
动态融合方法
多模态
相机
判断图像数据
多尺度
激光雷达数据采集
多通道
概率密度函数
3D点云
数据处理模块
融合激光雷达
数据生成图像
匹配网络
激光雷达点云
运动状态信息
特征值
跨模态
系统为您推荐了相关专利信息
图像增强模块
Sobel边缘检测算法
编码器
Gabor滤波器
神经网络输出层
织物
参数生成方法
参数生成装置
子系统
触觉特征
家居控制系统
家居控制方法
家电设备
大语言模型
多模态