基于用户指令强调的听障人士交流方法及系统

正文

推荐专利

申请号：CN202510847138

申请日期：2025-06-24

公开号：CN120412103B

公开日期：2025-10-21

类型：发明专利

摘要

本发明提供一种基于用户指令强调的听障人士交流方法及系统，方法包括：获取待处理的手语视频和用户指令信息；利用基于Transformer架构的视觉模型对待处理的手语视频进行特征提取，获得手语动作特征矩阵；基于所述手语动作特征矩阵分别获取指令强调的手语动作特征向量和时空强调的手语动作特征矩阵；将所述指令强调的手语动作特征向量和时空强调的手语动作特征矩阵进行特征融合，获得融合后的手语动作特征矩阵；基于所述融合后的手语动作特征矩阵通过预设的语音合成模型，获得待处理的手语视频对应的语音信息。本发明达到了显著提高手语识别的准确率的技术效果。

技术关键词

动作特征手语矩阵指令情感类别情感特征语音视频交叉注意力机制蒸馏模糊特征多模态情感识别 sigmoid函数模糊集合损失函数优化多分支自然语言图像面部电子设备

系统为您推荐了相关专利信息

一种基于类内空间一致性的图像特征匹配优化方法

匹配优化方法汉明距离特征点求解线性方程组特征匹配方法

一种燃料电池故障诊断方法、设备及介质

线性回归模型电池阻抗谱学习方法元件周期

视频来源识别方法和装置

大语言模型来源识别方法文本视频帧自动语音识别技术

一种基于高速公路服务区的物流场站选址评价方法

高速公路服务区物流评价方法评价指标体系阶段

一种基于RFID平板机的溯源系统及装置

分析模块预警模块平板机溯源系统溯源信息

基于用户指令强调的听障人士交流方法及系统

站点导航

APP 下载