一种基于改进TSM-ResNet50时空网络模型的唇语识别系统及方法

正文

推荐专利

申请号：CN202510100197

申请日期：2025-01-22

公开号：CN120071436A

公开日期：2025-05-30

类型：发明专利

摘要

本发明涉及人工智能、计算机视觉与语音处理技术领域，具体是一种针对聋哑人士及嘈杂环境下语音识别需求的基于改进TSM‑ResNet50时空网络模型的唇语识别系统及方法；该系统通过融合YOLOv7目标检测算法、TSM‑ResNet50时空网络模型以及GRU网络和注意力机制等深度学习技术，实现了对唇语视频数据的高效、准确识别，并采用了B/S架构和轻量级Flask框架，实现了唇语识别的可视化展示，极大地提高了用户体验。本发明的提出，旨在为聋哑人士提供更加便捷、高效的交流方式，同时推动唇语识别技术的发展和应用。

技术关键词

门控循环单元网络注意力机制唇语识别系统唇语识别技术识别模块残差网络文本特征提取能力视频深度学习技术可视化模块特征提取模块实时语音计算机视觉字幕算法

系统为您推荐了相关专利信息

一种用户身份识别系统、方法及相关装置

身份识别系统动作特征图像分割残差模块身份识别方法

一种多端同步的报名考试通知方法及系统

字段任务调度信息增益算法索引节点

一种基于视觉大模型的行人重识别方法

重识别方法特征提取模块分布特征视觉标签

一种多源融合下的碳资产价格预测方法

变量价格预测方法资产多源融合序列

变电站目标检测方法、装置、电子设备和存储介质

变电站巡检注意力机制上下文特征巡检机器人变电站机器人巡检

一种基于改进TSM-ResNet50时空网络模型的唇语识别系统及方法

站点导航

APP 下载