摘要
本公开涉及文本数据生成技术领域,提供了一种文本数据生成方法、装置、电子设备及介质。该方法可以通过多粒度图像编码器对图像数据进行语义处理,得到图像数据的语义特征;通过第一多层感知机对图像数据的语义特征进行处理,得到第一语义特征;通过第一文本编码器和第二文本编码器对提示文本数据处理,得到第二语义特征和第三语义特征;对第一语义特征、第二语义特征、第三语义特征进行拼接处理,得到图像数据的目标语义数据;通过大语言模型对图像数据的目标语义数据进行处理,得到图像数据的反馈文本数据。本公开显著提升了图像和文本之间的语义理解能力,解决了现有技术中的多个关键问题,为多模态人工通用智能系统的发展提供了有力支持。
技术关键词
语义特征
图像编码器
文本编码器
多层感知机
文本数据生成方法
大语言模型
融合特征
注意力
检测器
数据生成技术
数据生成装置
视觉
电子设备
可读存储介质
处理器
系统为您推荐了相关专利信息
风险预估模型
管理终端
实时位置
管理方法
验证设备
动态调度优化方法
柔性作业车间调度
嵌入特征
深度强化学习
异构
图像嵌入
变换器
文本编码器
可读存储介质
计算机
智能分类方法
三维超声图像
超声造影
点云模型
数据
图像语义分割方法
图像语义分割模型
注意力
图像语义分割网络
图像编码器