摘要
本发明公开了一种基于改进LLaVA的草莓病害多模态视觉问答方法,属于人工智能技术领域,包括获取多种草莓病害植株图像,基于草莓病害植株图像构建草莓病害视觉问答数据集;对LLaVA模型进行改进;使用改进后的LLaVA模型进行微调,得到草莓病害视觉问答模型;根据草莓病害视觉问答模型进行问答。本发明采用上述方法,通过对LLaVA模型进行改进,提高了对草莓病害植株的识别能力,提高了模型对草莓病害诊断与决策的准确率。
技术关键词
草莓病害
视觉问答方法
视觉问答模型
视角
多模态
裁剪模块
高分辨率图像分割
增强子
大语言模型
局部细节特征
交叉注意力机制
训练集
人工智能技术
像素
模运算
矩阵
系统为您推荐了相关专利信息
分区
可视化方法
节点
设备参数信息
多模态数据分析
能力测试方法
平衡能力评估
平衡能力测试
光学动作捕捉设备
感官
AR眼镜
城市热环境
生成对抗网络
智能感知方法
太阳高度角
水位预测方法
气象站
注意力机制
水位监测数据
多模态