一种基于多层级注意力扩散模型的手语骨骼点序列生成方法

AITNT
正文
推荐专利
一种基于多层级注意力扩散模型的手语骨骼点序列生成方法
申请号:CN202410750413
申请日期:2024-06-12
公开号:CN118628616A
公开日期:2024-09-10
类型:发明专利
摘要
一种基于多层级注意力扩散模型的手语骨骼点序列生成方法,包括:获取手语图片中人的上半身和手部关键点和相对应的Gloss数据,将获取的高维度手语关键点数据映射到低维度空间中,将原始的手语序列帧数据转换为更紧凑、更具有表征性的隐空间表征Latent。同时,将Gloss数据由文本序列处理为向量形式,输入深度学习模型Gloss‑Based Latent Space Predictor(GLSP),预测得到手语关键点的隐空间表征Latent。将所述生成的隐空间表征Latent输入正向扩散模型,采用分区域冻结网络的训练方式,通过逐渐添加高斯噪声的方式来对原始数据进行破坏,随后在反向扩散阶段,通过学习逆转扩散过程,进而从噪声数据中恢复原始输入数据,利用生成模型去预测原始手语骨骼点分布;生成手语骨骼点序列具有连贯性强、语义准确的优点。
技术关键词
手语 序列生成方法 空间预测器 区域特征提取 序列帧 手部关键点 注意力 噪声数据 文本 语义特征 特征数据信息 网络 滑动窗口 关节点 深度学习算法
系统为您推荐了相关专利信息
1
一种基于生成式序列帧图像的稀疏视图建筑三维重建方法及装置
序列帧 三维重建方法 生成三维建筑模型 图像 模型训练模块
2
一种iPS前体细胞智能捕获与识别方法、装置、电子设备及存储介质
预测分类模型 体细胞 识别方法 分类特征 训练集
3
时序可视化序列帧生成方法、控制器和存储介质
三维数据场 序列帧 生成方法 时序 颜色
4
一种高性能复合水凝胶的制备方法及在手势识别中的应用
复合水凝胶 高性能 丙烯酰胺单体 手语手势 表面活性剂
5
用于特殊需求群体的多模态一体化辅助系统及方法
手语 子系统 处理单元 语音 转换文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号