一种基于多模态数据的大语言模型融合方法、设备及介质

AITNT
正文
推荐专利
一种基于多模态数据的大语言模型融合方法、设备及介质
申请号:CN202411451064
申请日期:2024-10-17
公开号:CN118965283B
公开日期:2024-12-13
类型:发明专利
摘要
本发明公开了一种基于多模态数据的大语言模型融合方法、设备及介质,具体涉及数据融合技术领域,用于解决现有的多模态融合过程中忽视了保持各模态独特性的重要性的问题,通过从文本和图像数据中提取高维的语义和视觉特征,利用自编码器进行语义特征和视觉特征的解耦处理区分出通用特征和模态特定特征,通过计算模态间的互信息和分析模态间的互补性,确定各模态之间的依赖程度和独特信息的贡献;在允许融合后,在变分自编码器框架中生成的融合潜在表示捕获各模态的综合信息,通过KL散度评估信息损失;通过对融合后的信息熵变异度和信息损失的综合分析,全面评估融合模型在保持模态独特性方面的表现。
技术关键词
模型融合方法 模态特征 通用特征 信息熵 文本 语义特征 多模态 图像视觉特征 编码器框架 数据融合技术 重构 可读存储介质 处理器 指数 电子设备
系统为您推荐了相关专利信息
1
基于多模态文本-图学习的洗钱检测方法、系统
嵌入特征 文本 交叉注意力机制 前馈神经网络 多模态特征融合
2
社会调查中的智能行业编码方法及装置
编码方法 神经网络模型 文本 Sigmoid函数 预训练语言模型
3
基于动态原型学习和弱监督语义分割的道路缺陷检测方法
道路缺陷检测 像素 原型 图像 颜色
4
一种基于对抗进化的动态反诈决策方法
决策方法 样本 语义 识别标签 文本
5
基于大语言模型的可控示意图生成方法、系统及存储介质
大语言模型 布局 生成方法 规划 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号