摘要
本发明涉及一种基于统一空间映射的农业多模态问答模型及构建方法,本发明的构建方法通过自动化构建数据集,采用统一空间映射的多模态语义对齐方法,该方法通过独立映射图像和文本嵌入至同一特征表示空间,综合考虑图像间、文本间及图像与文本之间的关联关系,从而提升多模态数据的对齐效果。本发明将表达相同语义的图像或文本特征用集合表示,使集合内部表达同一语义的多模态特征向量能够在新的对齐空间中集中分布,同时降低表达不同语义集合之间的相似性,从而提高对齐的精度和内容输出的质量。此外,该方法在有效的多模态特征表示基础上,增强了对不同语义信息的理解和处理,从而提高了农业多模态问答模型的准确性和全面性。
技术关键词
多模态
问答模型
语义
数据分布
文本编码器
农业
映射方法
局部尺度参数
解码器
文本特征向量
模型构建方法
对齐方法
图像嵌入
大语言模型
数据解码
模态特征
系统为您推荐了相关专利信息
海上风电机组
故障检测方法
风电机组叶片
多模态
异构
图像智能分析方法
造影剂
上采样
动态
生成对抗网络
静电导出装置
静电释放装置
视频流
融合特征
轮廓信息
启停控制装置
多模态交互
标识单元
信号处理单元
无人机专用