一种基于OCR的旅客遗失物查找方法、系统和可读介质

正文

推荐专利

申请号：CN202411557744

申请日期：2024-11-04

公开号：CN119540934A

公开日期：2025-02-28

类型：发明专利

摘要

本发明属于计算机视觉和机器学习技术领域，涉及一种基于OCR的旅客遗失物查找方法、系统和可读介质，包括：获取对遗失物的描述文本，并提取描述文本中的关键信息；将关键信息以及数据库中的遗失物图像输入多模态大模型中，通过其中的图像编码器和文本编码器，分别提取出图文对齐的文本特征和图像特征；通过跨模态匹配算法，获得文本特征和图像特征的匹配值；将数据库中的遗失物图像输入OCR深度学习模型，提取遗失物图像中的文字信息；通过文字信息对匹配值进行修正；将经过修正的匹配值进行从高到低排列，选择前若干个图像作为遗失物查找结果。其能够增强铁路遗失物对诸如图书、药品、食品等带有名称、品牌等文字信息图像的检索效果。

技术关键词

查找方法旅客文本编码器图像编码器跨模态深度学习模型多模态文本关键信息图文机器学习技术词性信息查找系统可读存储介质分词算法大语言模型计算机视觉输出模块

系统为您推荐了相关专利信息

基于深度学习与多光谱图像融合的高压设备缺陷检测方法

缺陷检测方法可见光图像电力高压设备紫外光双通道注意力

一种文本数据引导的自解耦图像增量分割方法

图像块特征原型视觉特征提取文本编码器

一种基于非增量递归互监督变分融合的多模态神经机器翻译方法

视觉特征神经机器翻译方法文本噪声重构

智能问答方法及装置

多模态复杂度意图识别模型智能问答方法数据

基于深度学习的课堂多模态数据处理方法与系统

动态时间规整算法语义动态规划算法跨模态注意力

一种基于OCR的旅客遗失物查找方法、系统和可读介质

站点导航

APP 下载