语音处理方法、装置及XR设备

AITNT
正文
推荐专利
语音处理方法、装置及XR设备
申请号:CN202511049200
申请日期:2025-07-29
公开号:CN120564748B
公开日期:2025-11-07
类型:发明专利
摘要
本发明提供一种语音处理方法、装置及XR设备,涉及语音处理技术领域,其中方法应用于扩展现实XR设备,包括:获取当前场景图像及用户的当前头部姿态数据;根据所述当前场景图像和所述当前头部姿态数据,确定目标注视对象;获取所述目标注视对象的实时音频数据和实时视频数据;通过语音分离模型,对所述实时音频数据和所述实时视频数据进行处理,确定所述目标注视对象的目标音频信号。本发明能够在不增加XR设备的额外硬件成本、且无需依赖目标说话对象的先验信息的前提下,准确地识别出目标说话对象的语音信号。
技术关键词
实时视频 对象 语音 数据 音频编码器 音频解码器 音视频 人脸检测算法 分块 场景 图像 音频特征 时间滑动窗口 视觉特征 坐标系 信号 序列
系统为您推荐了相关专利信息
1
插件并行调度方法及电子设备和存储介质
大语言模型 并行调度方法 插件数据 生成执行计划 规划
2
一种基于GIS的园林规划系统
地形特征提取 子模块 三维地形数据 水文 生态系统
3
一种低轨Walker星座构型维持智能调控系统及方法
星座构型 轨道 参数 智能调控系统 智能模型
4
一种基于大模型和语义图谱的智能问答实现方法及系统
语义图谱 命名实体识别 大语言模型 动态 神经网络训练
5
基于区块链与联邦学习的人工智能数据隐私保护系统
人工智能数据 隐私保护系统 零知识证明 隐私保护模块 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号