摘要
本发明涉及轨道交通听力辅助技术领域,公开了一种基于多模态感知的轨道交通听力障碍语音辅助系统。系统包括多模态数据采集模块,用于获取语音信号、环境振动信号及视觉唇语信息;语音增强处理模块,利用深度降噪网络生成去噪语音流;振动信号解析模块,提取振动特征向量并构建映射模型;唇语识别模块,生成唇语文本预测结果;多模态融合模块,通过动态加权融合模型输出增强语音辅助信息流。该系统通过多模态数据采集与融合技术,有效解决了轨道交通环境中听力障碍人群获取语音信息困难的问题,提高了信息获取的准确性和全面性,提升了听力障碍者的出行体验和安全性。
技术关键词
语音辅助系统
多模态数据采集
轨道交通环境
时间序列图像组
门控循环单元
唇语识别
关键帧
听力辅助技术
双向长短期记忆网络
重构技术
动态时间规整算法
信号
校正算法
人耳听觉特性
非线性映射关系
空间金字塔池化
注意力
系统为您推荐了相关专利信息
农作物生长状态
评价方法
滑动窗口
卡尔曼滤波算法
影像
耗材管理方法
Unity3D引擎
进化系统
多模态数据采集
手术室智能
弹性伸缩方法
资源供应
引入注意力机制
强化学习算法
门控循环单元网络
辅助决策方法
模糊综合评价
燃气轮机
循环神经网络模型
灰色关联度
车辆轨迹预测方法
灰狼优化算法
引入注意力机制
轨迹算法
门控循环单元网络