一种基于检索增强生成和思维链技术的视觉推理方法

正文

推荐专利

申请号：CN202510462070

申请日期：2025-04-14

公开号：CN119990334B

公开日期：2025-08-22

类型：发明专利

摘要

本申请涉及一种基于检索增强生成和思维链技术的视觉推理方法，包括：对输入的原始图像进行预处理，并将预处理后的原始图像划分为多个感兴趣区域；对输入的问题进行分词和词嵌入，得到问题特征表示；用思维链技术对每个感兴趣区域进行逐步推理，并将得到的各推理文本按序组合生成多步推理文本；采用检索增强生成技术基于问题和多步推理文本在外部知识库中进行检索，得到知识片段；将多步推理文本与知识片段一同输入至优化后的生成模型，得到初步推理结果；采用BERT预训练模型检验初步推理结果的逻辑一致性，检验合理后通过BERT预训练模型对初步推理结果进行精简，得到最终推理结果。该方法能够有效提高视觉推理模型的准确性和稳定性。

技术关键词

文本特征向量图像特征向量推理方法感兴趣生成技术损失函数优化视觉注意力分词图像块检索方法矩阵逻辑样本编码标记表达式序列

系统为您推荐了相关专利信息

一种基于植物株型结合L-System理论的2D空间逆推方法及装置

逆推方法像素点端点节点深度优先遍历

一种压力性损伤个案管理系统及构建方法

患者管理大数据压力特征提取单元感兴趣

商品特征生成模型、商品的识别和聚类方法及商品管理系统

商品特征商品管理系统词嵌入向量大语言模型关键词

基于AI智能体的门店销售实时交互辅助系统及方法

交互辅助系统客户文本子模块感兴趣

一种智慧医院病房远程视频监测管理系统

数据交互模块特征提取模块融合特征远程视频监测节点

一种基于检索增强生成和思维链技术的视觉推理方法

站点导航

APP 下载