摘要
本公开实施例公开了一种插画提示语生成方法、装置、电子设备和存储介质,通过获取插画、以及该插画的原始提示语,并对该插画和该原始提示语分别进行特征提取,得到插画特征和提示语特征。进一步,对插画特征和提示语特征进行融合,并将融合特征和该提示语特征进行合并,从而根据合并后的特征,生成更加细致和丰富的目标提示语,即目标提示语可以对插画进行全面、准确的描述,从而使得用户可以对插画进行全面、准确的理解。
技术关键词
融合特征
交叉注意力机制
生成方法
电子设备
预训练模型
特征提取模块
多层感知机
处理器
非线性
生成装置
存储装置
可读存储介质
多模态
程序
解码器
文本
计算机
系统为您推荐了相关专利信息
音频分块
字幕生成方法
语音活动检测
离线语音识别模型
文本
血管造影图像数据
血管三维模型
断层扫描图像
生成方法
计算机可读指令