摘要
本发明涉及专利信息分析技术领域,尤其涉及一种基于多模态表征融合的专利图像少样本分类方法。所述方法包括以下步骤:通过设计语言分支、视觉分支以及视觉辅助分支构建混合预训练模型;获取所输入对应的专利图像少样本并进行图像特征并行提取和文本描述特征生成,得到专利图像文本提示描述特征;通过采用注意力机制设计跨模态融合层并进行多模态表征融合和特征融合损失计算,以得到语言分支和视觉分支之间的对比学习损失以及视觉辅助分支损失;对混合预训练模型进行模型融合优化以输出融合特征,并构建专利图像少样本分类框架以执行对应的专利图像少样本分类工作。本发明能够充分融合学习专利图像样本对应的特征表示以提高模型的分类效果。
技术关键词
样本分类方法
预训练模型
视觉特征提取
分支
图像多模态
文本编码器
图像编码器
矩阵
分类工作
大语言模型
图像类别
词嵌入向量
负载特征
融合特征
跨模态
系统为您推荐了相关专利信息
过载保护方法
中心控制系统
自动开关装置
负载监测单元
ARIMA模型
环境图像数据
图像增强模型
亮暗图像
光源
点扩散函数
视觉特征提取
视频帧特征
心理健康检测
表情特征
动作特征
射流
流道结构
工质
高热流密度芯片
芯片散热技术