多模态图文生成方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411400219

申请日期：2024-09-30

公开号：CN119399318A

公开日期：2025-02-07

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了多模态图文生成方法、装置、设备及存储介质，方法包括：对预设产品图像进行特征提取，生成第一特征向量，采用预设的多层感知机对第一特征向量进行转换，得到转换后的第一特征向量；将转换后的第一特征向量和第二特征向量进行拼接，得到第三特征向量；对第三特征向量进行编码，得到第四特征向量；将第四特征向量输入多模态模型的生成器，获取生成器基于第四特征向量输出的预测多模态图文，根据预测多模态图文和预设多模态图文之间的损失值，训练多模态模型；获取训练后的多模态模型基于当前产品图像生成的当前多模态图文。本发明有利于提高当前多模态图文的生成效率，可应用于金融科技业务领域中。

技术关键词

多模态图文生成方法多层感知机图像编码器可读存储介质人工智能技术处理器注意力机制编码模块生成装置网络计算机设备输入模块存储器金融

系统为您推荐了相关专利信息

基于图像处理技术的沥青路面骨料级配预测方法及装置

沥青路面集料颗粒图像处理技术序列预测模型图像分割网络

一种具有定位特征的面膜布、面膜布检测模块及检测方法

面膜布深度卷积生成对抗网络关键特征点人体特征语义分割技术

物联网水表自动检测系统

水表自动检测系统物联网水表运动驱动装置网络检测模型供水装置

一种基于对偶跨模态信息解耦的多模态电力样本特征迁移方法、系统、电子设备及存储介质

注意力机制迁移方法视觉特征跨模态融合特征文本

基于深度学习的脑血管影像识别分析系统

识别分析系统配准图像序列 CT造影图像脑血管病变引入注意力机制

多模态图文生成方法、装置、设备及存储介质

站点导航

APP 下载