摘要
本发明公开了一种基于混合现实设备的语音定位方法、装置、设备和介质。其特征包括:响应于用户输入对用户交互图像的语音控制指令,确定语音控制指令对应的目标坐标;根据所述目标坐标确定所述用户交互图像中的目标图像物体和所述目标图像物体对应的定位坐标信息;通过预设的标记方式在所述用户交互图像中对所述目标图像物体进行标记,并展示所述定位坐标信息。本发明能够在混合现实画面中标记用户通过语音定位的物体,并展示物体的现实坐标,实现在虚拟世界、现实世界和用户之间通过语音构建交互反馈的功能,提高用户获取定位信息的效率。
技术关键词
语音控制指令
混合现实设备
语音定位方法
图像
标记方式
语音定位装置
语音识别模型
展示物体
可读存储介质
计算机
生成方式
坐标系
处理器通信
定位模块
云端
系统为您推荐了相关专利信息
可见光图像
全景成像方法
全景成像系统
液晶可调谐滤光片
调谐滤光装置
大语言模型
训练系统
语音交互设备
图像采集设备
多模态交互
信息处理模型
作业方式
终端设备
电网管理
成票方法