基于图结构和多模态大模型的解耦表征学习方法和设备

正文

推荐专利

申请号：CN202410965299

申请日期：2024-07-18

公开号：CN118865058A

公开日期：2024-10-29

类型：发明专利

摘要

本发明涉及一种基于图结构和多模态大模型的解耦表征学习方法和设备，方法包括如下步骤：获取原始图像信息并进行关键点检测；利用预设的语义编码器，将关键点检测结果映射至预设的隐空间中，得到细粒度表征解耦后的属性因子，其中，所述隐空间中每个隐码维度独立表示一个属性或表征；针对属性因子进行初始化，基于关键点检测结果和初始化后的属性因子，通过与预设的大语言模型交互得到属性因子间的关联关系；基于属性因子和属性因子间的关联关系进行结构化编码，利用预设的更新器对预先建立的图结构进行更新，基于解码器生成的图像和所述原始图像信息进行自监督优化，实现解耦表征学习。本发明实现了复杂数据和真实场景中的语义感知和表征解耦。

技术关键词

表征学习方法因子关键点图像解码器关系学习设备电子设备编码模块程序可读存储介质存储器处理器肤色节点指令人脸语义

系统为您推荐了相关专利信息

超宽薄壁实体高墩温度场实时监控及裂缝预警系统及方法

裂缝模型高墩温度场预处理图像数据预警方法实时图像

一种遥感图像的超分辨率处理方法及相关设备

超分辨率模型图像特征提取分支深层特征提取计算机可读指令

一种基于多模态感知的大模型意图识别方法及系统

意图识别方法多模态音频运维意图识别系统

一种基于MR影像组学预测肿瘤EPR效应的方法及系统

组学特征特征选择算法效应支持向量机机器学习算法

车辆异常检测方法、数据处理方法、装置、设备及存储介质

图像块预训练模型车辆异常检测方法计算机执行指令图像采集装置

基于图结构和多模态大模型的解耦表征学习方法和设备

站点导航

APP 下载