基于手语识别及多声源定位的听障人群辅助系统

AITNT
正文
推荐专利
基于手语识别及多声源定位的听障人群辅助系统
申请号:CN202410751054
申请日期:2024-06-12
公开号:CN118658357A
公开日期:2024-09-17
类型:发明专利
摘要
本发明公开了一种基于手语识别及多声源定位的听障人群辅助系统,包括有MR眼镜、手语捕捉系统和声源定位系统。所述MR眼镜用于听障人群佩戴,并实时识别手语,声源定位并可视化声音;所述手语捕捉系统通过捕捉采集的视频流中的手部运动信息,提取出关键点的位置和运动轨迹;所述声源定位系统包括有语音识别单元、麦克风阵列和多声源追踪单元。所述声源定位系统采用多种算法进行声源定位及多声源追踪。本申请基于MR技术,能够进行环境声音可视化和声源定位,将发出声音的位置和具体信息显示给聋哑人,通过聋哑人一端佩戴的MR设备就可以实现和普通人的无障碍交流,系统较为完整的满足了聋哑人对声音方面的日常需求。
技术关键词
声源定位系统 手语 辅助系统 关键点 MR眼镜 捕捉系统 语音识别单元 算法 多声源 麦克风阵列 混响环境 MR技术 手部特征 深度神经网络 视频流 残差网络 运动 关节点 聚类
系统为您推荐了相关专利信息
1
一种基于多维度特征约束与流形自补偿的激光雷达动态配准方法及系统
动态配准方法 局部线性嵌入算法 流形学习算法 动态校正 节点
2
一种基于多层级注意力扩散模型的手语骨骼点序列生成方法
手语 序列生成方法 空间预测器 区域特征提取 序列帧
3
一种用于机器人表情模仿控制的脸部关键点检测算法
机器人表情 脸部关键点 后处理技术 特征提取模块 分辨率
4
一种基于虚拟现实的篮球体育训练方法
体育训练方法 虚拟现实训练 动作规范 关键点 运动员
5
虚拟形象生成方法、装置、设备、存储介质及程序产品
图像生成模型 模版 脸部特征 虚拟形象生成方法 姿势
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号