基于唇语识别的多模态抗干扰通信方法及系统

正文

推荐专利

申请号：CN202511290434

申请日期：2025-09-10

公开号：CN121011191A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于唇语识别的多模态抗干扰通信方法及系统，属于通信设备技术领域。该方法包括：获取人脸唇部视频流和音频信号；响应于常规模式触发信号，对唇部视频流和音频信号分别进行特征提取并将提取结果融合，生成融合特征向量；结合唇部运动信息对融合特征向量进行语音增强，输出音频增强信号；响应于无声通信模式触发信号，基于人脸唇部视频流进行唇语识别，以获取唇语识别文本，将唇语识别文本转换为语音。能够结合两种模态信息实现在超强噪声环境下的清晰稳定通信，解决了现有高噪声环境影响通信质量的问题以及特种场景下对移动式无声静默通讯的需求。

技术关键词

抗干扰通信方法唇语识别视频流时空卷积神经网络语音特征视频特征向量 ROI图像文本抗干扰通信系统人脸关键点检测时域音频信号姿态估计方法 MFCC特征视觉特征提取音频采集模块序列

系统为您推荐了相关专利信息

一种语音控制的封箱打包机

封箱打包机夹持输送机构封箱机台封箱机机芯封箱机构

基于麦克风的定向音频拾取方法和系统

序列拾取方法信号麦克风音频

一种水利工程智能监控系统及方法

智能监控方法多源监测数据深度置信网络模型流速智能监控系统

一种基于序列建模的流式语音识别方法

流式语音识别方法语音识别模型语音类别序列移动设备

一种视频增强方法、图像增强装置、产品及存储介质

显示功能信息图像增强装置视频流图像增强算法图像增强模块

基于唇语识别的多模态抗干扰通信方法及系统

站点导航

APP 下载