摘要
本发明涉及一种基于多模态大模型的问答数据处理方法及系统,属于数据处理技术领域。包括以下步骤:通过构建关系图捕捉多模态中的细粒度特征关系,获取融合后的多模态特征;通过计算多模态融合特征与知识库中所有知识向量的相似度,设置阈值筛选知识向量构建知识子集;将构建的知识子集输入机器学习模型对用户的问答输入进行意图与场景识别;通过将获取的所有特征进行拼接后输入BLIP的解码器,进行生成预测答案;通过多轮对话收集用户反馈,根据用户反馈生成激励信号不断更新识别特征。本发明通过多模态融合特征进行跨模态知识检索构建知识子集,同时基于知识子集获取识别特征,为用户生成拓展性的引导答案,提升了问答的准确性和满意度。
技术关键词
问答数据处理方法
融合特征
识别特征
跨模态
多模态特征融合
机器学习模型
文本
细粒度特征
意图
答案
强化学习框架
图像
关系
场景
数据处理系统
多轮对话
网格
系统为您推荐了相关专利信息
监督学习算法
多模态数据融合
个性化特征
样本
跨模态
YOLO模型
检测无人机
融合特征
无人机航拍图像
异构特征
知识问答方法
缓存策略
语义检索技术
计算机执行指令
检索策略
故障推理方法
热力系统
时空图卷积神经网络
切片
时序