摘要
本发明公开了一种基于文本反演的构图理解方法、系统,该方法采用基于优化的文本反演算法将输入的图像转换为pseudo‑token,对原始文本与pseudo‑token进行拼接,将拼接后的文本转换为特征向量,计算文本与图像的相似度。本方法在减少对硬负样本依赖的情况下提高构图理解模型的理解能力,提高模型交互效率,同时减少时间消耗。
技术关键词
深度学习模型
理解系统
反演算法
文本编码器
图像编码器
标记
迭代算法
数据输入模块
查找表
特征提取模块
拼接模块
语义
模板
样本
系统为您推荐了相关专利信息
演绎系统
演绎方法
数据收集模块
中央控制模块
特征提取模块
误差修正方法
深度学习模型
气象
参数
误差修正装置
地质沉降监测方法
融合深度学习
时空分辨
因子
掩膜
三维医学影像数据
左心房
中心线
空间结构
深度学习模型