一种融合大语言模型的神经辐射场植株渲染方法及装置

正文

推荐专利

申请号：CN202510914606

申请日期：2025-07-03

公开号：CN120411325B

公开日期：2025-09-02

类型：发明专利

摘要

本发明公开了一种融合大语言模型的神经辐射场植株渲染方法及装置，该方法通过采集带文本提示符的植株图像集合，利用大语言模型从植株图像对应的文本提示符中提取语义信息，生成伪标签；使用伪标签，以对多视角植株图像之间的几何对应关系与单张植株图像内部的自监督关系对分割模型进行微调；将植株图像的位置参数输入神经网络模型预测得到新的图像参数，再通过体渲染公式进行渲染图像生成；加入不确定性估计损失同时给定目标文本提示符，以分割模型生成在每个输入视图上的二维分割图预测监督信号进行学习训练，输出三维植株渲染图像。本发明的方法在遮挡和小目标的复杂场景重建性能表现优异，为复杂果树场景高效重建提供了新的解决方案。

技术关键词

大语言模型渲染方法无人机摄像装置图像数据处理模块文本无人机拍摄装置输入神经网络模型主动学习策略视角颜色标签深度值采样点参数多层感知机渲染装置语义关系

一种融合大语言模型的神经辐射场植株渲染方法及装置

站点导航

APP 下载