一种基于大语言模型增熵的文本图像匹配方法及系统

AITNT
正文
推荐专利
一种基于大语言模型增熵的文本图像匹配方法及系统
申请号:CN202411541502
申请日期:2024-10-31
公开号:CN119646528A
公开日期:2025-03-18
类型:发明专利
摘要
本发明涉及计算机视觉技术领域,提出一种基于大语言模型增熵的文本图像匹配方法及系统,其中包括:将数据集图像特征通过视觉注意力编码器得到原始图像编码;基于原始图像编码构建超图并通过超图神经网络生成超图图像特征;将超图图像特征与原始图像编码进行残差联结构建视觉超图适应器;利用图像特征描述生成的第一文本特征通过提示学习方法诱导大语言模型生成同义语料,得到经过增熵的融合文本特征;对融合文本特征和第一文本特征进行编码;基于多维特征编码构建超图并通过超图神经网络生成超图文本特征;将超图文本特征降维后结合原始语料特征编码构建文本超图适应器;基于视觉超图适应器和文本超图适应器计算相似度矩阵,得到相似度排名。
技术关键词
图像匹配方法 大语言模型 图像编码 注意力编码器 计算机可读指令 文本编码器 学习方法 图像匹配系统 矩阵 计算机视觉技术 数据 特征提取模型 捕获特征 特征提取模块 学习特征
系统为您推荐了相关专利信息
1
一种基于采集,视频审核的智能驾驶数据标注方法
数据标注方法 动态规则库 车载传感器 运动轨迹预测 车辆状态信息
2
视频内容检索方法以及智能电视
视频内容检索方法 文本 图片 关键帧 语音
3
一种大语言模型的Token级缓存匹配方法、系统及存储介质
语义主题 BERT模型 大语言模型 输入输出单元 上下文特征
4
基于图文混合推理的三维室内场景生成方法及系统
文本 隐式特征 场景生成系统 场景生成方法 三维模型
5
一种基于多模态大语言模型解析表格的方法
大语言模型 多模态 表格 矩阵 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号