摘要
本发明涉及一种基于图结构和多模态大模型的解耦表征学习方法和设备,方法包括如下步骤:获取原始图像信息并进行关键点检测;利用预设的语义编码器,将关键点检测结果映射至预设的隐空间中,得到细粒度表征解耦后的属性因子,其中,所述隐空间中每个隐码维度独立表示一个属性或表征;针对属性因子进行初始化,基于关键点检测结果和初始化后的属性因子,通过与预设的大语言模型交互得到属性因子间的关联关系;基于属性因子和属性因子间的关联关系进行结构化编码,利用预设的更新器对预先建立的图结构进行更新,基于解码器生成的图像和所述原始图像信息进行自监督优化,实现解耦表征学习。本发明实现了复杂数据和真实场景中的语义感知和表征解耦。
技术关键词
表征学习方法
因子
关键点
图像
解码器
关系
学习设备
电子设备
编码模块
程序
可读存储介质
存储器
处理器
肤色
节点
指令
人脸
语义
系统为您推荐了相关专利信息
裂缝模型
高墩温度场
预处理图像数据
预警方法
实时图像
超分辨率模型
图像特征提取
分支
深层特征提取
计算机可读指令
组学特征
特征选择算法
效应
支持向量机
机器学习算法
图像块
预训练模型
车辆异常检测方法
计算机执行指令
图像采集装置