摘要
本申请涉及一种基于多模态问答的层级检索方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。方法包括:接收多模态输入数据,多模态输入数据包括图像数据和相应的待解答问题数据;对预设知识库中的文档数据和多模态输入数据进行编码处理,得到预设知识库中的文档数据的特征向量和多模态输入数据的图像特征向量;根据预设知识库中的文档数据的特征向量,针对图像特征向量在预设知识库中进行至少一次文本检索,得到文本检索结果;将文本检索结果整合为输入序列,将输入序列输入至多模态问答模型中,生成待解答问题数据的相应答案文本。采用本方法能够提升检索效果和知识整合效率,增强多模态问答系统的性能和灵活性。
技术关键词
图像特征向量
多模态
问答模型
检索方法
答案
计算机设备
计算机程序产品
序列
系统级
层级
文本编码器
数据接收模块
可读存储介质
检索装置
问答系统
处理器
搜索算法
系统为您推荐了相关专利信息
矩阵
多模态数据融合
数据获取模块
评估脑功能
动态
多参数
特征提取单元
视觉特征
注意力机制
多模态数据采集
数据通信方法
编解码模块
多模态特征
云端
编解码器