样本对生成、大模型的训练、图像检索方法及装置、设备和介质

正文

推荐专利

申请号：CN202410875590

申请日期：2024-07-01

公开号：CN118643342A

公开日期：2024-09-13

类型：发明专利

摘要

本公开提供了一种样本对生成、大模型的训练、图像检索方法及装置、设备和介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于OCR等场景。该样本对生成方法包括：对图像样本进行处理，得到对象信息；根据提示词信息和对象信息，生成图像说明文本，其中，提示词信息包括系统提示信息和任务提示信息，图像说明文本用于描述图像样本的属性；以及，根据图像样本和图像说明文本，生成样本对。

技术关键词

多模态样本编码特征图像特征提取特征提取模块视觉特征检索对象图像检索方法文本行印章变换器光学字符识别文本识别输入模块图像检索装置

样本对生成、大模型的训练、图像检索方法及装置、设备和介质

站点导航

APP 下载