一种基于KAN增强的非自回归手语生成方法、介质以及设备

正文

推荐专利

申请号：CN202510687423

申请日期：2025-05-27

公开号：CN120512588A

公开日期：2025-08-19

类型：发明专利

摘要

一种基于KAN增强的非自回归手语生成方法、介质以及设备，属于计算机视觉技术技术领域。本发明为解决现有基于自回归架构生成手语视频的方法，在生成手语长序列时局部误差会随序列长度的增加而持续传播，导致生成的手语视频动作细节不充分、动作的时序连贯性差的问题。本发明使用非自回归机制的Transformer模型，使用时空自注意力机制代替多头注意力机制，采用KAN网络替换MLP层，使用动态双曲正切函数替换传统编码器和解码器的层归一化，并行生成手语骨骼序列，然后对生成的手语骨骼序列进行运动学优化和逐帧渲染得到细节展示充分、动作连贯的手语视频。主要用于将文本数据生成手语视频。

技术关键词

手语生成方法双曲正切函数序列计算机视觉技术技术语义特征拟合算法多头注意力机制关节骨骼关键点视频样条归一化方法计算机存储介质批量缩放参数变量解码器编码

系统为您推荐了相关专利信息

一种海上风电场输电线路的智能故障定位方法及系统

多源监测数据故障特征动态路径优化海上风电场输电智能故障定位方法

一种显示设备及语音拒识方法

显示设备声学特征音频拒识方法文本

一种基于有向无环图的CHUNJUN数据同步工作流调度方法及系统

数据同步工作流调度方法有向无环图工作流调度系统重试机制

基于联邦学习的个体心理态势感知预警系统

智能终端预警模型预警系统识别特征云端

一种康复陪护机器人的智能化监护方法

对象陪护机器人监护方法像素点双曲正切函数

一种基于KAN增强的非自回归手语生成方法、介质以及设备

站点导航

APP 下载