摘要
本申请公开了一种基于共同最优性的图片‑文本匹配方法,属于图文匹配技术领域。该方法包括:获取目标文本,计算目标文本与标准文本集的距离,得到目标文本距离的概率分布,标准文本集包括多个标准文本,每个标准文本为目标文本对应场景的参考文本;将目标文本输入到文生图模型中,得到候选图片集,候选图片集包括多张候选图片;计算候选图片集与标准图片集的距离,得到候选图片集中每张候选图片距离的概率分布;计算候选图片集中每张候选图片距离的概率分布与目标文本距离的概率分布之间的KL散度,将KL散度最小的候选图片作为目标文本匹配的目标图片。该方法提升了图文匹配的准确性和效率。
技术关键词
文本匹配方法
图片
图像生成器
编码器模块
图文匹配技术
非暂态计算机可读存储介质
文本匹配装置
分词
处理器
匹配模块
场景
参数
存储器
电子设备
标记
程序
系统为您推荐了相关专利信息
多阈值图像
图像增强方法
图像亮度信息
拉普拉斯金字塔
色调映射方法
建模方法
图片
生成三维模型
机载激光扫描仪
地面激光扫描仪
标定板
相机标定方法
数据处理终端
立体视觉深度
图片
图片
神经网络模型
编辑
计算机系统执行
意图识别