图像问答方法、装置及介质

AITNT
正文
推荐专利
图像问答方法、装置及介质
申请号:CN202510174585
申请日期:2025-02-17
公开号:CN120126166A
公开日期:2025-06-10
类型:发明专利
摘要
本申请提供一种图像问答方法、装置及介质,涉及计算机技术领域。所述方法包括:基于特征点将问答图像分割成多个第一问答图像块;获取第一问答图像块中与用户问题相关度大于第一阈值的若干个第二问答图像块;基于中间语言模型获取所述问答图像的第一概述和所述若干个第二问答图像块的第二概述;基于大语言模型根据所述第一概述和所述第二概述获取所述用户问题的答案。本申请基于特征点分割图像,筛选与用户问题高相关性的图像块,根据整体图像和高相关性的局部图像块,利用中间语言模型捕获图像的全局信息和局部信息,增强中间自然语言对视觉图像的概述,最后使用大语言模型根据概述获得对用户问题的高质量回答。
技术关键词
图像块 图像问答方法 大语言模型 图像分割 特征点 注意力神经网络 答案 深度学习特征 文本编码器 图像编码器 可读存储介质 问答装置 模块 自然语言 模板 计算机 坐标 尺寸
系统为您推荐了相关专利信息
1
基于AI、RPA和AI Agent的软件交互方法、装置和设备
交互组件 接口 大语言模型 软件交互方法 生成提示信息
2
一种基于人工智能的外呼质检方法、系统、设备及介质
质检方法 大语言模型 文本 报告 质检系统
3
基于多模态的消化道肿瘤病灶图像分割方法及分割系统
组织病理图像 图像分割方法 侵袭深度 层次结构模型 多模态
4
基于多路径融合卷积的图像分割方法、装置、设备和介质
卷积模块 编码特征 多路径 采样模块 医学图像分割
5
一种资产申报异常行为识别方法、装置、介质及设备
资产 大语言模型 样本 关键词 语句
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号