基于多模态时空融合与SE(3)流形优化的声纹持续跟踪系统及其跟踪方法

正文

推荐专利

申请号：CN202511050126

申请日期：2025-07-29

公开号：CN120869091A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种基于多模态时空融合与SE(3)流形优化的声纹持续跟踪系统及其跟踪方法，包括以下步骤：S1:获取来自部署在用户佩戴设备上的麦克风阵列的声学信号、来自惯性测量单元的惯性数据、以及可选地来自摄像头的视觉数据;S2:估计所述用户佩戴设备的实时位姿，所述位姿在SE(3)流形上表示;S3:定义声源的联合状态向量，所述状态向量包含声源在世界坐标系下的三维位置和声纹特征向量;S4:构建一个在SE(3)流形上运行的贝叶斯滤波框架，利用所述实时位姿。其结合波场合成理论和神经辐射场技术，构建扩展的声学NeRF模型，利用估计的声源状态和眼镜位姿，实时重建动态的全息声场和空间分布的声纹特征，并在 XR 设备中进行可视化的问题。

技术关键词

跟踪方法多模态麦克风阵列贝叶斯滤波佩戴设备跟踪系统声纹特征梅尔频率倒谱系数神经处理单元辐射场技术空间权重矩阵优化信噪比多模型算法动态全息计算机程序指令融合视觉数据坐标系身份

系统为您推荐了相关专利信息

一种跨网数据安全交换方法

数据安全交换方法攻击检测模型传输路径节点多模态

一种铁路轨道多模态振动波的测试方法、装置及设备

铁路轨道结构小波变换处理多模态测试方法曲线

一种面向无人艇的目标检测与跟踪方法及系统

水面视频帧跟踪方法 RANSAC算法全局运动估计

基于跨模态交互增强与知识蒸馏的快速RGBT目标跟踪方法

可见光跨模态特征提取网络教师学生

图像生成方法、装置及显示设备

图像生成模型多模态信息网络图像生成方法输入区

基于多模态时空融合与SE(3)流形优化的声纹持续跟踪系统及其跟踪方法

站点导航

APP 下载