摘要
本发明涉及数据分析技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种基于分层检索的问题答案生成方法、装置、设备及介质,所述方法包括:根据若干文档、文档标题和文档关联图像构建多模态知识库,对获取的待分析图像和目标用户问题进行编码,得到图像特征向量和问题特征向量,确定图像特征向量与文档标题的第一相似度,并从多模态知识库内筛选出目标相关文档,确定问题特征向量与目标相关文档的文档段落的第二相似度,并从目标相关文档内筛选出候选段落集合,利用候选段落集合对图像特征向量和问题特征向量进行自回归答案分析,得到目标问题答案。本发明提高了多模态大语言模型在处理需要外部知识的视觉问答任务时的准确性。
技术关键词
图像特征向量
答案生成方法
大语言模型
多模态
分层
索引
文本编码器
文本段落
序列
适配器
数据分析技术
处理器
医疗健康
语义特征
电子设备
系统为您推荐了相关专利信息
膈肌肌电信号
声波特征
深度卷积神经网络
皮尔逊相关系数
脸部关键点
组件特征
组件封装
深度强化学习方法
异构特征
协同优化算法