摘要
本申请涉及增强现实领域,提供了一种基于增强现实技术的展示系统及方法,其首先获取虚拟场景图像和真实场景图像并进行场景图像语义级特征融合,同步获取用户交互意图的自然语言描述进行语义理解,接着通过提取虚实场景的语义级特征编码表示,结合自然语言描述的多粒度语义嵌入,利用递归式跨模态注意力机制逐层强化用户意图表征,最终生成与场景上下文高度适配的交互画面。这样,通过跨模态层级交互递归机制,突破了传统单模态意图识别的局限性,实现了动态场景语义与用户语言意图的深度耦合,为高沉浸感AR交互提供了新的技术路径,提升了用户的参与感。
技术关键词
真实场景图像
编码向量
意图
现实技术
展示系统
图像特征编码
自然语言
特征提取单元
跨模态
交互特征
压缩单元
场景上下文
编码模块
语义特征提取
分析单元