视觉问答方法、装置、电子设备、存储介质和计算机程序产品

AITNT
正文
推荐专利
视觉问答方法、装置、电子设备、存储介质和计算机程序产品
申请号:CN202510621772
申请日期:2025-05-14
公开号:CN120146205B
公开日期:2025-08-12
类型:发明专利
摘要
本公开关于视觉问答方法、装置、电子设备、存储介质和计算机程序产品,该方法包括:获取目标图像以及针对目标图像的目标问题;基于目标问题,生成初始程序;向初始程序添加用于记录程序执行过程的目标代码;将目标图像输入扩展程序,获得针对目标问题的预测答案、扩展程序的执行过程信息以及截图图像;基于执行过程信息和截图图像,生成针对预测答案的多模态形式的解释。这样,可以在输出预测答案的同时同步生成决策依据图片以及语义关联分析,即可以增加输出对预测答案的推理过程的解释,使用户能够直观地了解图像特征与语义推理的对应关系,进而可以提升推理透明度和决策可信度,从而有利于视觉问答技术的推广应用。
技术关键词
视觉问答方法 答案 图像 应用程序编程接口 程序生成模块 计算机程序产品 自然语言 裁剪工具 视觉问答技术 电子设备 多模态 文本 处理器 可读存储介质 问答装置 大语言模型 扩展模块 检测器 对象
系统为您推荐了相关专利信息
1
复杂背景环境下的温室番茄实例分割方法及装置
实例分割方法 温室番茄 特征金字塔 掩膜 实例分割算法
2
圆盘双刻度识别方法、系统及转台
刻度线 主刻度尺 识别方法 圆盘 直线段
3
深度引导频域感知的层次化语义聚合网络的伪装目标检测方法
层次化语义 注意力 RGB特征 多尺度特征 输出特征
4
一种织物外观平整度智能视觉评级装置与方法
三角网格模型 织物外观 双目立体相机 织物试样 棋盘格标定
5
一种检测和分析道路设施损坏的系统及方法
图像采集设备 识别模块 图像采集模块 视觉 云端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号