图像问答方法、装置及介质

正文

推荐专利

图像问答方法、装置及介质

申请号：CN202510174585

申请日期：2025-02-17

公开号：CN120126166A

公开日期：2025-06-10

类型：发明专利

摘要

本申请提供一种图像问答方法、装置及介质，涉及计算机技术领域。所述方法包括：基于特征点将问答图像分割成多个第一问答图像块；获取第一问答图像块中与用户问题相关度大于第一阈值的若干个第二问答图像块；基于中间语言模型获取所述问答图像的第一概述和所述若干个第二问答图像块的第二概述；基于大语言模型根据所述第一概述和所述第二概述获取所述用户问题的答案。本申请基于特征点分割图像，筛选与用户问题高相关性的图像块，根据整体图像和高相关性的局部图像块，利用中间语言模型捕获图像的全局信息和局部信息，增强中间自然语言对视觉图像的概述，最后使用大语言模型根据概述获得对用户问题的高质量回答。

技术关键词

图像块图像问答方法大语言模型图像分割特征点注意力神经网络答案深度学习特征文本编码器图像编码器可读存储介质问答装置模块自然语言模板计算机坐标尺寸

系统为您推荐了相关专利信息

基于AI、RPA和AI Agent的软件交互方法、装置和设备

交互组件接口大语言模型软件交互方法生成提示信息

一种基于人工智能的外呼质检方法、系统、设备及介质

质检方法大语言模型文本报告质检系统

基于多模态的消化道肿瘤病灶图像分割方法及分割系统

组织病理图像图像分割方法侵袭深度层次结构模型多模态

基于多路径融合卷积的图像分割方法、装置、设备和介质

卷积模块编码特征多路径采样模块医学图像分割

一种资产申报异常行为识别方法、装置、介质及设备

资产大语言模型样本关键词语句

图像问答方法、装置及介质

站点导航

APP 下载