一种基于实时共享Transformer的多模态特征级融合方法

AITNT
正文
推荐专利
一种基于实时共享Transformer的多模态特征级融合方法
申请号:CN202411660801
申请日期:2024-11-20
公开号:CN119513816A
公开日期:2025-02-25
类型:发明专利
摘要
本发明涉及一种基于实时共享Transformer的多模态特征级融合方法,涉及多模态数据处理技术领域。该方法包括:将图像信息、文本信息、语音信息分别传入到映射模块,得到三种编码切片的嵌入向量;将三种编码切片的嵌入向量分别传入到普通transformer编码模块,得到三种编码令牌;将三种编码令牌同时传入到实时共享transformer编码模块,得到三种共享编码;三种共享编码传入自适应性融合模块,得到一个包含所有模态信息的联合特征表示。该方法通过将多模态数据转换为嵌入向量,进行特征提取和编码之后,进行跨模态信息共享,最后在自适应性融合模块中整合所有模态的信息,实现将多模态信息更加全面有机地融合。
技术关键词
图像编码 语音编码 令牌 模态特征 融合方法 切片 文本 音频编码 编码模块 前馈神经网络 编码特征 注意力机制 多模态 数据处理技术 融合系统
系统为您推荐了相关专利信息
1
一种基于视觉和语言的X光片分析方法及装置
大语言模型 分析方法 跨模态 注意力 图像
2
基于遥操作机器人任务的多模态数据特征提取与优化方法
数据特征提取 彩色图像 机器人操作系统 机器人模仿学习 多模态特征
3
一种智能客服交互方法及相关装置
智能客服 语音特征 交互方法 面部特征 情感特征
4
基于多模态分析的房颤射频消融术后复发预测方法
复发预测方法 射频消融术 频谱特征分析 房颤 轨迹聚类算法
5
一种图像数据辅助标注方法、装置和设备
数据辅助标注方法 图像分割模型 语义 图像特征向量 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号