基于时空网络模型的唇语识别方法、装置、介质及产品

正文

推荐专利

申请号：CN202411920684

申请日期：2024-12-25

公开号：CN119851345A

公开日期：2025-04-18

类型：发明专利

摘要

本发明公开一种基于时空网络模型的唇语识别方法、装置、介质及产品，涉及唇语识别技术领域。该方法包括：获取待识别唇语视频图像；识别待识别唇语视频图像的每帧图像中的唇部位置，根据唇部位置，分割对应的唇部图像，得到按时间顺序排列的多个目标唇部图像；将多个目标唇部图像输入至唇语识别模型，得到唇语预测结果；唇语识别模型包括时空网络模型、门控循环单元、注意力机制和softmax函数；唇语预测结果为待识别唇语视频图像表达的文字。本发明能够提高唇语的识别精度和检测速度。

技术关键词

识别方法图像门控循环单元注意力机制网络视频唇语识别技术样本处理器计算机装置模块计算机程序产品输入端可读存储介质存储器数据算法

系统为您推荐了相关专利信息

一种考虑电力消耗的通信网络优化方法、装置及设备

通信网络优化方法综合评估模型节点电力通信方法网元设备

用于光伏发电功率预测的时空组合预测模型构建方法、光伏发电功率预测方法及相关装置

组合预测模型光伏发电功率预测卷积网络模型格兰杰因果关系气象

一种基于Spark负载均衡的任务调度方法和系统

执行器任务调度方法集群矩阵匈牙利算法

权重矩阵设计方法、装置、设备及存储介质

矩阵半定规划分布式模型节点数分布式系统

一种基于电力线网络双模通信的通信控制方法

通信控制方法动态网络拓扑数据编解码统计量集合

基于时空网络模型的唇语识别方法、装置、介质及产品

站点导航

APP 下载