一种基于多层级注意力扩散模型的手语骨骼点序列生成方法

正文

推荐专利

申请号：CN202410750413

申请日期：2024-06-12

公开号：CN118628616A

公开日期：2024-09-10

类型：发明专利

摘要

一种基于多层级注意力扩散模型的手语骨骼点序列生成方法，包括：获取手语图片中人的上半身和手部关键点和相对应的Gloss数据，将获取的高维度手语关键点数据映射到低维度空间中，将原始的手语序列帧数据转换为更紧凑、更具有表征性的隐空间表征Latent。同时，将Gloss数据由文本序列处理为向量形式，输入深度学习模型Gloss‑Based Latent Space Predictor(GLSP)，预测得到手语关键点的隐空间表征Latent。将所述生成的隐空间表征Latent输入正向扩散模型，采用分区域冻结网络的训练方式，通过逐渐添加高斯噪声的方式来对原始数据进行破坏，随后在反向扩散阶段，通过学习逆转扩散过程，进而从噪声数据中恢复原始输入数据，利用生成模型去预测原始手语骨骼点分布；生成手语骨骼点序列具有连贯性强、语义准确的优点。

技术关键词

手语序列生成方法空间预测器区域特征提取序列帧手部关键点注意力噪声数据文本语义特征特征数据信息网络滑动窗口关节点深度学习算法

系统为您推荐了相关专利信息

一种基于生成式序列帧图像的稀疏视图建筑三维重建方法及装置

序列帧三维重建方法生成三维建筑模型图像模型训练模块

一种iPS前体细胞智能捕获与识别方法、装置、电子设备及存储介质

预测分类模型体细胞识别方法分类特征训练集

时序可视化序列帧生成方法、控制器和存储介质

三维数据场序列帧生成方法时序颜色

一种高性能复合水凝胶的制备方法及在手势识别中的应用

复合水凝胶高性能丙烯酰胺单体手语手势表面活性剂

用于特殊需求群体的多模态一体化辅助系统及方法

手语子系统处理单元语音转换文本

一种基于多层级注意力扩散模型的手语骨骼点序列生成方法

站点导航

APP 下载