摘要
本发明涉及数据处理技术领域,公开了一种基于目标检测与规则增强图文问答方法、装置及电子设备,其中,方法包括:获取并存储目标对象的多个基础图像;将基础图像输入到预先构建的目标检测模型,提取基础图像的第一特征数据;将第一特征数据输入到预先构建的规则增强模型,提取基础图像的第二特征数据;将第二特征数据转换成文本描述语句;根据多个基础图像以及多个文本描述语句生成多个图文描述对;响应于接收到针对目标对象的提问信息,将提问信息转换为目标语义向量,基于目标语义向量从多个图文描述对中检索出目标图文描述对,根据目标图文描述对生成针对提问信息的答复信息。本发明的方法,能够实现图像内容的深度理解与语义级问答。
技术关键词
图文
问答方法
语义向量
对象
图像
基础
空间约束条件
语句
文本
前端采集设备
关系
典型
电子设备
可读存储介质
问答装置
数据处理技术
处理器
程序
模式
系统为您推荐了相关专利信息
学生心理健康教育活动
中央控制系统
智能触控笔
压力传感器阵列
情绪识别系统
现场校核方法
无人机数据采集
无人机路径规划
特征融合网络
执行现场
医疗数据处理方法
项目
训练预测模型
文本
训练样本数据
表面缺陷检测系统
缺陷高度
样本
陶瓷
数据采集模块