摘要
本发明提供一种融合学习者历史的多模态问答方法及设备,涉及多模态问答技术领域,包括:通过ResNet模型对知识视觉数据进行嵌入操作,获得知识特征表示;通过BERT模型对问题文本进行嵌入操作,获得问题特征表示;将知识特征表示和问题特征表示进行基于时间跨度的融合,获得时间融合知识特征;将历史特征和时间融合知识特征进行融合,获得融合特征表示;通过问题特征表示和融合特征表示计算获得各候选答案的预测概率,将预测概率最高的候选答案作为问题文本的最终答案。本发明依据学习者的学习记录数据、历史成绩数据和知识视觉数据精准定位其知识短板与兴趣偏好,提高问题回答的精准度。
技术关键词
问答方法
融合特征
数据
成绩
层级
BERT模型
答案
多头注意力机制
文本
问答技术
视觉
表达式
身份
矩阵
金字塔
多模态
处理器
爬虫
元素
系统为您推荐了相关专利信息
语义向量
工具推荐方法
非易失性存储介质
对象
样本
误差监测方法
连续箱梁桥
残差注意力机制
误差预测
物理
节能设计方法
雨水收集模块
太阳能板
建筑屋顶
建筑群
混凝土强度预测
高维特征向量
频域特征
时域特征
数学模型
数字孪生模型
紫砂作品
计算机辅助软件
多层次
材料数据库