摘要
本公开提供了基于大语言模型的图像检测方法、图像识别方法、装置、电子设备、存储介质和程序产品,涉及人工智能技术领域,尤其涉及计算机视觉技术领域、深度学习技术领域、智能问答技术领域和大模型技术领域。具体实现方案为:响应于检测指令,确定目标对象指定的文件图像和检测需求信息;对文件图像进行文件结构检测,得到文件图像表征的文件结构属性;以及利用大语言模型处理文件结构属性和检测需求信息,以便于从文件图像中确定与检测需求信息相匹配的目标文件信息。
技术关键词
融合特征
表格
图像块
大语言模型
多尺度特征提取
图像检测方法
图像识别方法
注意力机制
指令
智能问答技术
文本识别
上采样
图像检测装置
电子设备
处理器通信
对象
图像识别装置
系统为您推荐了相关专利信息
双目视觉特征
特征学习网络
立体视觉感知
立体图像数据
模块
数据安全管理系统
异常信息
云平台
数据安全管理方法
错误率
异常状态
监测方法
无监督学习
卷积神经网络提取
石油