摘要
本发明公开了一种基于多模态数据的健康状态分类方法、系统、设备及介质,其涉及健康状态评估与分类技术领域,其目的在于解决现有模型在进行身体健康识别、分类时存在参数量大、模型在复杂任务中表现能力有待提升,难以满足对多模态数据进行健康状态分类的需求的技术问题。其分类网络模型的多模态融合编码器是在经典的transformer模型的基础上,将创新的多模态注意力模块改进到transformer模型的多头注意力中得到多模态注意力子模块,并在多模态注意力子模块与前馈网络之间引入一个卷积子模块,这样可以显著提高transformer内单个编码器的特征学习能力,从而减少transformer内编码器的数量,以在保证模型性能的前提下最大程度地减少模型参数量。
技术关键词
健康状态分类方法
分类网络
多模态注意力
健康状态数据
样本
长短期记忆网络
子模块
融合特征
特征提取模块
音频特征
编码器
文本
模型训练模块
数据获取模块
图像
标签
系统为您推荐了相关专利信息
情绪分析方法
情绪识别模型
多场景
面部关键点
人脸
负载监控方法
多模态数据融合
数据处理器
辊筒输送系统
负载传感器
标签继承
边缘检测模型
模型训练方法
图像边缘特征
测量方法
医学图像分割方法
文本编码器
医学图像数据集
视觉
图像嵌入