摘要
本发明涉及一种基于神经辐射场的可解释可控三维重建方法,通过整合解耦表征学习(DRL)和多模态大语言模型(MLLMs),有效发掘和识别潜在的三维语义。同时,利用专门设计的神经辐射场(NeRF)模型,保持高质量和视角一致的三维重建。通过这种方法,本发明不仅确保了重建的准确性,还赋予模型类似人脑的语义感知和理解能力。通过这种方法,本发明在确保重建准确性的同时,赋能模型类人脑的语义感知和理解能力,进一步构建从数据、信息到语义、知识及规则的多尺度、多层次、可解释的模型自主决策机制,从而在语义层面实现“先理解,再解耦,后控制”,最终形成可解释可控的新一代三维重建框架。
技术关键词
三维重建方法
图像
三维重建系统
变量
解码器
网络
语义层面
多模态
大语言模型
人脑
教师
识别模块
视角
蒸馏
多层次
学生
速度
关键点
像素点
系统为您推荐了相关专利信息
推理方法
压缩器
动态任务调度器
网络监视器
DNN模型