一种唇语识别方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202510646116

申请日期：2025-05-20

公开号：CN120182771B

公开日期：2025-08-15

类型：发明专利

摘要

本申请公开了一种唇语识别方法、装置、设备、介质及产品，涉及机器视觉和自然语言处理交叉领域，该方法包括获取待识别的原始视频，初始化文本序列，对原始视频进行切割，得到多个帧图像，提取每个帧图像的帧内特征及帧间特征。根据全部帧图像的帧间特征，得到视频特征。根据视频特征以及文本序列，采用唇语识别模型，得到唇语识别结果。唇语识别模型为预先根据训练样本集搭建的神经网络多模态融合模型。本申请通过获取每个帧图像的帧内特征和帧间特征，得到视频特征，并进一步通过将文本序列以及视频特征进行多模态特征融合，提高了模型的特征表现能力和区分度，并进一步提高了唇语识别的准确性。

技术关键词

唇语识别方法文本图像训练样本集序列标签深度学习算法编码向量强化特征多模态特征融合视频特征提取交叉注意力机制字符

系统为您推荐了相关专利信息

一种应用于3D打印机的异物检测方法及3D打印机

异物检测方法图像识别模型打印机热床注意力

一种无功补偿装置故障自动预警方法

无功补偿装置故障自动预警方法故障案例库设备故障预警综合故障诊断

麻辣风味的智能调配方法、装置、电子设备及存储介质

色度参数智能调配方法辣椒油树脂麻辣风味偏差

高通量基因测序的并行处理同步优化方法及系统

高通量基因测序矩阵参数序列凸优化算法

基于Hough变换的路面目标识别方法及系统

广义Hough变换参数空间搜索识别方法路面非暂态计算机可读存储介质

一种唇语识别方法、装置、设备、介质及产品

站点导航

APP 下载