基于语义指导的零样本泛化三维物体重建方法

AITNT
正文
推荐专利
基于语义指导的零样本泛化三维物体重建方法
申请号:CN202510090805
申请日期:2025-01-21
公开号:CN120047615B
公开日期:2025-12-05
类型:发明专利
摘要
本发明涉及一种基于语义指导的零样本泛化三维物体重建方法,属于计算机视觉和图像处理技术领域。该方法包括:利用了分数蒸馏采样策略在单幅图像三维重建过程中的优越性;设计提示词,指导多模态大语言模型生成对图像从粗粒度到细粒度的描述,指导三维结果的生成;采用了一种多模态数据对齐的策略,实现语义和视觉模态的对齐,将语义信息融入到生成的三维结构中。本发明能够以零样本泛化解决单幅图像生成三维物体结构的问题,并在真实数据集中对本发明进行实验验证,证明了本发明的优越性。
技术关键词
三维物体重建方法 隐式结构 大语言模型 多视角 三维结构 样本 多模态 网络 生成三维物体 噪声 语义特征 深度图 文本编码器 图像编码器 法线贴图
系统为您推荐了相关专利信息
1
一种基于人工智能技术的幼儿对话系统
幼儿 对话系统 人工智能机器人 数据储存模块 教师
2
大语言模型的任务感知解码方法、装置、设备及存储介质
大语言模型 解码方法 标签 解码装置 处理器
3
用于大语言模型的模型评估方法、装置、介质及设备
模型评估方法 评估工作流 大语言模型 节点 指令
4
一种基于大模型的影视剧智能缩编方法
影视剧 大语言模型 行人重识别算法 视频场景分割 脚本
5
基于视频大语言模型的手术视频分析方法及相关设备
大语言模型 视频分析方法 文本 手术 语言模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号