一种基于改进LLaVA的草莓病害多模态视觉问答方法

AITNT
正文
推荐专利
一种基于改进LLaVA的草莓病害多模态视觉问答方法
申请号:CN202511200131
申请日期:2025-08-26
公开号:CN121033635A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于改进LLaVA的草莓病害多模态视觉问答方法,属于人工智能技术领域,包括获取多种草莓病害植株图像,基于草莓病害植株图像构建草莓病害视觉问答数据集;对LLaVA模型进行改进;使用改进后的LLaVA模型进行微调,得到草莓病害视觉问答模型;根据草莓病害视觉问答模型进行问答。本发明采用上述方法,通过对LLaVA模型进行改进,提高了对草莓病害植株的识别能力,提高了模型对草莓病害诊断与决策的准确率。
技术关键词
草莓病害 视觉问答方法 视觉问答模型 视角 多模态 裁剪模块 高分辨率图像分割 增强子 大语言模型 局部细节特征 交叉注意力机制 训练集 人工智能技术 像素 模运算 矩阵
系统为您推荐了相关专利信息
1
一种船舶损管同步可视化方法及平台
分区 可视化方法 节点 设备参数信息 多模态数据分析
2
一种多模态主被动结合的平衡能力测试方法
能力测试方法 平衡能力评估 平衡能力测试 光学动作捕捉设备 感官
3
一种基于AR的便携式城市热环境智能感知方法和设备
AR眼镜 城市热环境 生成对抗网络 智能感知方法 太阳高度角
4
一种基于多模态融合和双流时空网络PredFormer的水位预测方法及装置
水位预测方法 气象站 注意力机制 水位监测数据 多模态
5
基于智能化感知与自动化响应预警的AI校园智防系统
校园 多模态数据融合 决策支持单元 安保 音频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号