一种基于实时共享Transformer的多模态特征级融合方法

正文

推荐专利

申请号：CN202411660801

申请日期：2024-11-20

公开号：CN119513816A

公开日期：2025-02-25

类型：发明专利

摘要

本发明涉及一种基于实时共享Transformer的多模态特征级融合方法，涉及多模态数据处理技术领域。该方法包括：将图像信息、文本信息、语音信息分别传入到映射模块，得到三种编码切片的嵌入向量；将三种编码切片的嵌入向量分别传入到普通transformer编码模块，得到三种编码令牌；将三种编码令牌同时传入到实时共享transformer编码模块，得到三种共享编码；三种共享编码传入自适应性融合模块，得到一个包含所有模态信息的联合特征表示。该方法通过将多模态数据转换为嵌入向量，进行特征提取和编码之后，进行跨模态信息共享，最后在自适应性融合模块中整合所有模态的信息，实现将多模态信息更加全面有机地融合。

技术关键词

图像编码语音编码令牌模态特征融合方法切片文本音频编码编码模块前馈神经网络编码特征注意力机制多模态数据处理技术融合系统

系统为您推荐了相关专利信息

一种基于视觉和语言的X光片分析方法及装置

大语言模型分析方法跨模态注意力图像

基于遥操作机器人任务的多模态数据特征提取与优化方法

数据特征提取彩色图像机器人操作系统机器人模仿学习多模态特征

一种智能客服交互方法及相关装置

智能客服语音特征交互方法面部特征情感特征

基于多模态分析的房颤射频消融术后复发预测方法

复发预测方法射频消融术频谱特征分析房颤轨迹聚类算法

一种图像数据辅助标注方法、装置和设备

数据辅助标注方法图像分割模型语义图像特征向量标签

一种基于实时共享Transformer的多模态特征级融合方法

站点导航

APP 下载