摘要
本发明提供了一种基于多模态变分自编码器的水果品质智能分级系统及方法,包括通过获取水果的不同光照下的图像,采用ViT‑Base模型提取RGB图像的全局语义特征;采用轻量级深度可分离卷积网络提取NIR图像的局部光谱特征;对可见光分支和近红外分支输出的特征分别进行潜在空间映射并进行重参数化采样获取潜在变量,计算通道注意力权重,通过变分推断层对双模态潜在分布进行KL散度约束对齐,并基于通道注意力机制动态分配融合权重,生成跨模态融合特征,输出融合特征;对融合特征进行多任务优化学习,基于任务相关性矩阵调整损失权重;输出糖度、水分及成熟度的联合预测结果。本发明提高品质检测的精度和效率;具有更高的鲁棒性。
技术关键词
智能分级系统
多模态
跨模态融合特征
通道注意力机制
可见光
编码器模块
智能分级方法
近红外噪声
分支
模态特征
多任务分类
语义特征
图片
图像
变量
系统为您推荐了相关专利信息
多模态情绪
智能问答方法
意图识别模型
情绪特征
答案
前列腺癌预测系统
指标
数据处理模块
图像处理模块
多模态
知识图谱构建方法
资产
数据预处理技术
节点
关系
定向天线阵列
声波传感器
便携式壳体
分辨率
深度神经网络