摘要
本发明为一种基于大模型和多模态的图文匹配分析方法、系统和装置,一所述方法包括如下步骤:1)图文解析:将图文解析出图像和文本;2)对于图像进行微调的多模态大模型处理,文字进行进行分词处理;3)构建平分权重;4)处理后的文字与构建平分权重进行构建Few‑shot提示词;5)将步骤4与步骤2中的文字和图片进行训练/微调作为大预言模型;6)相似度评分;7)对于评分进行解析。本发明通过引入多模态大模型与大语言模型的协同工作,综合利用其在语义理解、上下文分析和动态调整能力上的优势,建立了一种全面的图文匹配框架,可以提升匹配的准确性、灵活性和可解释性。
技术关键词
匹配分析方法
图文
文本
大语言模型
匹配分析系统
语义
文字处理方法
多模态
多语言
分词
风格
图像处理
模块
场景
图片
分析装置
自然语言
模板
动态
系统为您推荐了相关专利信息
语义关键词
搜索优化方法
语义特征
问答模型
热点
大语言模型
多层感知机层
加密
更新模型参数
列表
图像分类方法
特征提取网络
多模态信息
样本
原型