基于时空网络模型的唇语识别方法、装置、介质及产品

AITNT
正文
推荐专利
基于时空网络模型的唇语识别方法、装置、介质及产品
申请号:CN202411920684
申请日期:2024-12-25
公开号:CN119851345A
公开日期:2025-04-18
类型:发明专利
摘要
本发明公开一种基于时空网络模型的唇语识别方法、装置、介质及产品,涉及唇语识别技术领域。该方法包括:获取待识别唇语视频图像;识别待识别唇语视频图像的每帧图像中的唇部位置,根据唇部位置,分割对应的唇部图像,得到按时间顺序排列的多个目标唇部图像;将多个目标唇部图像输入至唇语识别模型,得到唇语预测结果;唇语识别模型包括时空网络模型、门控循环单元、注意力机制和softmax函数;唇语预测结果为待识别唇语视频图像表达的文字。本发明能够提高唇语的识别精度和检测速度。
技术关键词
识别方法 图像 门控循环单元 注意力机制 网络 视频 唇语识别技术 样本 处理器 计算机装置 模块 计算机程序产品 输入端 可读存储介质 存储器 数据 算法
系统为您推荐了相关专利信息
1
一种考虑电力消耗的通信网络优化方法、装置及设备
通信网络优化方法 综合评估模型 节点 电力通信方法 网元设备
2
用于光伏发电功率预测的时空组合预测模型构建方法、光伏发电功率预测方法及相关装置
组合预测模型 光伏发电功率预测 卷积网络模型 格兰杰因果关系 气象
3
一种基于Spark负载均衡的任务调度方法和系统
执行器 任务调度方法 集群 矩阵 匈牙利算法
4
权重矩阵设计方法、装置、设备及存储介质
矩阵 半定规划 分布式模型 节点数 分布式系统
5
一种基于电力线网络双模通信的通信控制方法
通信控制方法 动态网络拓扑 数据 编解码 统计量集合
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号