基于外部知识增强和语义一致的视觉对话方法和设备

正文

推荐专利

申请号：CN202411660296

申请日期：2024-11-20

公开号：CN119782457B

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及一种基于外部知识增强和语义一致的视觉对话方法和设备，方法包括：根据获取的图像、历史对话文本和当前问题文本，通过提取域内视觉对象间的关联关系和域内文本词汇间的关联关系构建多模态场景图，通过提取常识知识三元组构建常识知识库；基于常识知识库，对多模态场景图进行扩展并进行关系增强学习，得到关联增强节点的特征；利用预训练的大语言模型获取实例级表征，基于关联增强节点的特征得到文本常识级表征，针对实例级表征和常识级表征进行特征融合，得到全局的融合特征；基于融合特征，通过推理得到视觉对话的答案。本发明能够细致挖掘语义关联，使得多轮视觉对话在精准度、丰富性和全面性方面均有显著提升。

技术关键词

对话方法文本视觉场景融合特征答案语义隐式特征关系图像卷积神经网络提取三元组对象多模态特征排序损失节点特征序列编码

系统为您推荐了相关专利信息

一种皮肤科住院医师规范化培训教学过程管理方法

教学试题梅尔频率倒谱系数语义图谱管理方法成绩

一种藏语谣言模型训练方法、检测方法、装置

谣言检测方法语义特征注意力机制矩阵融合特征

车辆辅助驾驶方法及相关设备

车辆辅助驾驶方法驾驶员监控车辆辅助驾驶装置考试场景规划

语音翻译方法及相关装置、设备和存储介质

语音识别文本语音翻译方法错误校正语音识别模型大语言模型

一种基于人工智能的企业信息检索方法

信息检索方法多任务学习模型构建企业关系意图关系网络图

基于外部知识增强和语义一致的视觉对话方法和设备

站点导航

APP 下载