摘要
本申请公开了一种基于增强现实的实时物体交互方法及相关装置,涉及AR领域,包括:获取目标图像序列中真实物体的三维模型,基于获取的三维模型生成实时场景理解模型,对用户的实时视频序列进行多模态的意图识别处理,得到用户的实时意图识别结果,基于实时意图识别结果和实时场景理解模型,得到实时场景三维模型,根据实时场景三维模型和目标图像序列进行AR渲染,得到AR渲染结果。本申请的实时场景理解模型能够反映真实物体的实时变化,使得虚拟对象的行为能够随之变化,交互真实感更高,多模态的意图识别处理使虚拟对象与真实物体的交互方式与用户意图更相符,用户体验更好。
技术关键词
三维模型
图像
意图识别
物体
交互方法
序列
实时视频
场景
虚拟对象
融合深度图
稠密深度图
稀疏深度图
语义分割模型
多模态
计算机可读指令
电子设备
点云信息
注意力
手部关键点
系统为您推荐了相关专利信息
回复生成方法
多模态特征
聊天机器人
生成器网络
语音
加热控制方法
智能控制模块
收油机
热吹风系统
油池
溯源方法
痕迹特征
三维扫描数据
火灾现场
卷积神经网络提取
深度神经网络模型
食品安全智能检测
时间序列特征
融合特征
多模态