语音处理方法、装置及XR设备

正文

推荐专利

语音处理方法、装置及XR设备

申请号：CN202511049200

申请日期：2025-07-29

公开号：CN120564748B

公开日期：2025-11-07

类型：发明专利

摘要

本发明提供一种语音处理方法、装置及XR设备，涉及语音处理技术领域，其中方法应用于扩展现实XR设备，包括：获取当前场景图像及用户的当前头部姿态数据；根据所述当前场景图像和所述当前头部姿态数据，确定目标注视对象；获取所述目标注视对象的实时音频数据和实时视频数据；通过语音分离模型，对所述实时音频数据和所述实时视频数据进行处理，确定所述目标注视对象的目标音频信号。本发明能够在不增加XR设备的额外硬件成本、且无需依赖目标说话对象的先验信息的前提下，准确地识别出目标说话对象的语音信号。

技术关键词

实时视频对象语音数据音频编码器音频解码器音视频人脸检测算法分块场景图像音频特征时间滑动窗口视觉特征坐标系信号序列

系统为您推荐了相关专利信息

插件并行调度方法及电子设备和存储介质

大语言模型并行调度方法插件数据生成执行计划规划

一种基于GIS的园林规划系统

地形特征提取子模块三维地形数据水文生态系统

一种低轨Walker星座构型维持智能调控系统及方法

星座构型轨道参数智能调控系统智能模型

一种基于大模型和语义图谱的智能问答实现方法及系统

语义图谱命名实体识别大语言模型动态神经网络训练

基于区块链与联邦学习的人工智能数据隐私保护系统

人工智能数据隐私保护系统零知识证明隐私保护模块节点

语音处理方法、装置及XR设备

站点导航

APP 下载