摘要
本公开提供了一种基于大模型技术的书籍检索方法,涉及人工智能技术领域,尤其涉及自然语言处理、计算机视觉、大模型、生成模型技术领域。具体实现方案为:根据接收到的输入信息,生成待确定图书的图书描述文本;从目标区域图像中确定多个待匹配图书各自的子图像;根据待确定图书的图书描述文本以及多个待匹配图书各自的子图像,从多个待匹配图书中确定目标图书。本公开还提供了一种基于大模型技术的书籍检索装置、电子设备和存储介质。
技术关键词
图书
图像
书籍检索装置
转换文本
检索方法
语音
标记
电子设备
人工智能技术
计算机程序产品
计算机视觉
模块
颜色
处理器通信
自然语言
指令
系统为您推荐了相关专利信息
趋势预测系统
动态评估方法
特征提取模块
数据采集模块
服装图案设计
算法模型
推理方法
图像像素
图像分割
深度学习图像处理技术
影像识别方法
影像识别系统
便携式手持终端
图像识别模块
眼底图像特征