基于多模态输入的查询方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202510970181

申请日期：2025-07-14

公开号：CN120929556A

公开日期：2025-11-11

类型：发明专利

摘要

本申请提供一种基于多模态输入的查询方法、装置、设备、介质及产品。本申请通过由语言模型在接收到包括文本类查询语句和图像类辅助信息的多模态查询指令的情况下，基于多模态查询指令所包括的图像类辅助信息进行图像识别，以从图像类辅助信息中获取待查询的文本内容，从而调用预先配置好的查询工具，根据待查询的文本内容和文本类查询语句获取多模态查询指令对应的查询结果。通过本申请的实施例提供的技术方案，无需用户手动输入即可实现对图像类辅助信息中相关文本内容的获取，操作简便，从而可以提高查询效率，而且可以通过语言模型将输入都转换为文本形式，以基于文本形式的输入达到基于多模态输入的查询效果。

技术关键词

多模态文本语句查询方法参数指令图像处理器可读存储介质查询装置计算机程序产品识别模块存储器对象

系统为您推荐了相关专利信息

任务处理方法、装置及电子设备

界面图像语义模块手势特征

智慧城市建设耗材质量监测管理系统及方法

监测管理系统钢筋抗拉强度混凝土抗压强度参数时序特征

一种数据处理方法、装置、电子设备和存储介质

大语言模型数据处理方法网络参数样本

一种基于全速度域轮轨界面特性的铁路线路平纵断面设计方法

纵断面设计舒适度轮轨接触应力界面磨耗

一种掩码电路并行实现的安全评估方法、计算机设备

掩码电路密码算法信噪比密钥变量

基于多模态输入的查询方法、装置、设备、介质及产品

站点导航

APP 下载