场景生成与交互方法、装置、电子设备、介质和程序产品

正文

推荐专利

申请号：CN202510904718

申请日期：2025-07-01

公开号：CN120726238A

公开日期：2025-09-30

类型：发明专利

摘要

本公开实施例公开了一种场景生成与交互方法、装置、电子设备、介质和程序产品，利用单幅图像（提示图像）生成三维场景（第一三维场景图像），并通过调用预先训练好的多模态特征提取模型从提示图像中提取多模态二维特征图（多模态的语义特征），并通过蒸馏与融合算法将多模态二维特征图与三维场景（第一三维场景图像）融合为多模态特征场，最终渲染得到包括多模态二维特征场的目标场景，用户可以通过用户操作指令对所目标场景进行交互操作。如此，实现了在单图像交互式目标场景生成中，实时嵌入多模态的语义特征并保持高质量渲染，基于多模态的语义特征，可以完成用户操作指令解析、任务拆解等，以实现对目标场景的复杂场景查询与可组合编辑。

技术关键词

多模态特征场景计算机程序指令特征提取模型语义特征图像深度估计融合算法意图图像特征向量计算机程序产品交互方法文本插件序列蒸馏可视化方式

系统为您推荐了相关专利信息

一种基于AI的环境照明控制数据分析系统及方法

会议室环境照明控制控制照明设备视频会议场景数据分析系统

一种基于分布式多智能体强化学习的多星自主协同调度方法

分布式多智能体决策协同调度方法多智能体系统强化学习算法

基于大数据的个性化沟通培训内容生成方法

内容生成方法节点多模态特征大数据语音特征

一种触控交互界面的设计方法及系统

交互式模块布局优化算法追踪算法演化方法个性化界面

用于安保系统的网络安全验证方法及系统

网络安全验证方法生物特征识别安保系统生理特征数据分布式时间

场景生成与交互方法、装置、电子设备、介质和程序产品

站点导航

APP 下载