一种基于多模态数据的大语言模型融合方法、设备及介质

正文

推荐专利

申请号：CN202411451064

申请日期：2024-10-17

公开号：CN118965283B

公开日期：2024-12-13

类型：发明专利

摘要

本发明公开了一种基于多模态数据的大语言模型融合方法、设备及介质，具体涉及数据融合技术领域，用于解决现有的多模态融合过程中忽视了保持各模态独特性的重要性的问题，通过从文本和图像数据中提取高维的语义和视觉特征，利用自编码器进行语义特征和视觉特征的解耦处理区分出通用特征和模态特定特征，通过计算模态间的互信息和分析模态间的互补性，确定各模态之间的依赖程度和独特信息的贡献；在允许融合后，在变分自编码器框架中生成的融合潜在表示捕获各模态的综合信息，通过KL散度评估信息损失；通过对融合后的信息熵变异度和信息损失的综合分析，全面评估融合模型在保持模态独特性方面的表现。

技术关键词

模型融合方法模态特征通用特征信息熵文本语义特征多模态图像视觉特征编码器框架数据融合技术重构可读存储介质处理器指数电子设备

系统为您推荐了相关专利信息

基于多模态文本-图学习的洗钱检测方法、系统

嵌入特征文本交叉注意力机制前馈神经网络多模态特征融合

社会调查中的智能行业编码方法及装置

编码方法神经网络模型文本 Sigmoid函数预训练语言模型

基于动态原型学习和弱监督语义分割的道路缺陷检测方法

道路缺陷检测像素原型图像颜色

一种基于对抗进化的动态反诈决策方法

决策方法样本语义识别标签文本

基于大语言模型的可控示意图生成方法、系统及存储介质

大语言模型布局生成方法规划多模态

一种基于多模态数据的大语言模型融合方法、设备及介质

站点导航

APP 下载