摘要
本公开提供了一种图像识别方法、训练方法、装置、智能体、设备、介质和产品,涉及人工智能技术领域,尤其涉及大模型、自然语言处理和计算机视觉领域。该图像识别方法包括:根据与输入图像和输入问题对应的图像识别策略,对输入图像的多个候选视觉特征中的至少两个目标视觉特征进行融合,得到融合视觉特征,其中,图像识别策略指示了目标视觉特征的选择方式以及针对目标视觉特征的融合方式,以使融合视觉特征适配输入问题;以及根据融合视觉特征,确定用于输入问题的图像识别结果。
技术关键词
融合视觉特征
融合策略
局部视觉特征
全局视觉特征
特征选择
样本
图像识别方法
视觉特征提取
图像识别装置
多模态
人工智能技术
计算机程序产品
处理器
计算机视觉
训练装置
自然语言
指令
系统为您推荐了相关专利信息
电力现货交易
量预测方法
电网实时状态
离散粒子群优化算法
混合预测模型
注意力机制
防护装备
特征多尺度融合
空间金字塔池化
融合特征
应力
监测数据处理方法
航空紧固件
信号
监测数据处理系统