摘要
本发明公开了一种同质异质与属性信号解耦表示学习科学问答方法及系统,属于视觉问答领域,包括:通过编码器获取文本和视觉模态的初始嵌入;利用第一解耦模块将各模态的嵌入解耦为同质嵌入和异质嵌入,并进行融合得到各模态的初步表示;通过第二解耦模块,根据问题的属性信号对融合后的多模态嵌入进行进一步解耦,增强不同属性信号下嵌入的可区分性;将解耦后的表示与原始信息融合,通过解码器预测答案。本发明解决了现有科学问答模型中多模态信息同质性与异质性高度纠缠以及多种属性信号之间高度纠缠的问题。
技术关键词
文本
视觉
异质
问答方法
信号
多模态
编码器
多头注意力机制
答案
解码器
样本
问答模型
问答系统
融合策略
编码模块
输入接口
重构
可读存储介质
系统为您推荐了相关专利信息
皮肤护理系统
电子设备
识别模块
无线电接收器
振荡电路
无线供电通信网络
能效优化方法
WPCN系统
深度强化学习算法
信息数据处理终端
工程图纸
图像处理模型
文本
命名实体识别模型
像素点
苗木种植车
多机械手协同作业
种植器
抓取机械臂
管支座
差分隐私保护机制
车辆管理模块
多源信息融合
驾驶辅助方法
信号遮挡区域