一种基于改进LLaVA的草莓病害多模态视觉问答方法

正文

推荐专利

申请号：CN202511200131

申请日期：2025-08-26

公开号：CN121033635A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种基于改进LLaVA的草莓病害多模态视觉问答方法，属于人工智能技术领域，包括获取多种草莓病害植株图像，基于草莓病害植株图像构建草莓病害视觉问答数据集；对LLaVA模型进行改进；使用改进后的LLaVA模型进行微调，得到草莓病害视觉问答模型；根据草莓病害视觉问答模型进行问答。本发明采用上述方法，通过对LLaVA模型进行改进，提高了对草莓病害植株的识别能力，提高了模型对草莓病害诊断与决策的准确率。

技术关键词

草莓病害视觉问答方法视觉问答模型视角多模态裁剪模块高分辨率图像分割增强子大语言模型局部细节特征交叉注意力机制训练集人工智能技术像素模运算矩阵

系统为您推荐了相关专利信息

一种船舶损管同步可视化方法及平台

分区可视化方法节点设备参数信息多模态数据分析

一种多模态主被动结合的平衡能力测试方法

能力测试方法平衡能力评估平衡能力测试光学动作捕捉设备感官

一种基于AR的便携式城市热环境智能感知方法和设备

AR眼镜城市热环境生成对抗网络智能感知方法太阳高度角

一种基于多模态融合和双流时空网络PredFormer的水位预测方法及装置

水位预测方法气象站注意力机制水位监测数据多模态

基于智能化感知与自动化响应预警的AI校园智防系统

校园多模态数据融合决策支持单元安保音频

一种基于改进LLaVA的草莓病害多模态视觉问答方法

站点导航

APP 下载