基于思维链推理和跨模态融合的开放词汇三维物体可供性定位方法

AITNT
正文
推荐专利
基于思维链推理和跨模态融合的开放词汇三维物体可供性定位方法
申请号:CN202510331144
申请日期:2025-03-20
公开号:CN120219718A
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种基于思维链推理和跨模态融合的开放词汇三维物体可供性定位方法,包括:1、获取输入点云‑图像对进行编码;2、基于微调多模态大语言模型的可供性模型构建;3、基于可供性模型的多头可供性思维链推理策略;4、将推理获取的可供性知识进行编码融合;5、基于跨模态自适应融合模块对几何属性和点云特征进行融合;6、解码具有交互意图的图像特征和具有几何属性的点云特征实现对三维物体的可供性精准定位;7、构建可供性定位网络的总损失函数,并对网络进行训练。本发明综合考虑思维链的层级化推理范式与自适应融合的跨模态语义整合能力,从而实现对三维物体可供性的精准定位。
技术关键词
定位方法 大语言模型 图像 意图 sigmoid函数 跨模态 多模态 适配器 交互物体 输入解码器 文本编码器 可读存储介质 处理器 存储器 网络
系统为您推荐了相关专利信息
1
一种眼在手外的相机外参自适应标定方法及系统
机械臂基座 标定方法 坐标系 相机 矩阵
2
基于防爆巡检机器人的燃气分输站遗留物品检测方法
防爆巡检机器人 遗留物品检测 燃气 地图界面 巡检数据
3
芯玻璃酸蚀速率的检测方法及装置
图像 速率 板坯 散斑 像素点
4
基于BIM的机电设备智能化到货验收方法及装置
验收设备 设备标识码 机电设备智能化 成套机电设备 验收方法
5
一种基于倾斜角谱的反射成像装置及方法
反射成像装置 样本夹持装置 图像采集装置 成像方法 探针
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号