摘要
本发明公开一种基于时空网络模型的唇语识别方法、装置、介质及产品,涉及唇语识别技术领域。该方法包括:获取待识别唇语视频图像;识别待识别唇语视频图像的每帧图像中的唇部位置,根据唇部位置,分割对应的唇部图像,得到按时间顺序排列的多个目标唇部图像;将多个目标唇部图像输入至唇语识别模型,得到唇语预测结果;唇语识别模型包括时空网络模型、门控循环单元、注意力机制和softmax函数;唇语预测结果为待识别唇语视频图像表达的文字。本发明能够提高唇语的识别精度和检测速度。
技术关键词
识别方法
图像
门控循环单元
注意力机制
网络
视频
唇语识别技术
样本
处理器
计算机装置
模块
计算机程序产品
输入端
可读存储介质
存储器
数据
算法
系统为您推荐了相关专利信息
通信网络优化方法
综合评估模型
节点
电力通信方法
网元设备
组合预测模型
光伏发电功率预测
卷积网络模型
格兰杰因果关系
气象
通信控制方法
动态网络拓扑
数据
编解码
统计量集合