一种文本生成方法、装置及相关设备

正文

推荐专利

一种文本生成方法、装置及相关设备

申请号：CN202411052435

申请日期：2024-08-01

公开号：CN119067178A

公开日期：2024-12-03

类型：发明专利

摘要

本申请提供一种文本生成方法、装置及相关设备，涉及人工智能的技术领域，所述方法包括：对待预测图像进行编码，得到图像特征；根据所述图像特征对关联所述待预测图像的非图像特征进行计算，得到第一注意力信息，以及根据所述非图像特征对所述图像特征进行计算，得到第二注意力信息，所述非图像特征用于表示所述待预测图像的上下文语境；对所述第一注意力信息和所述第二注意力信息进行融合，得到目标注意力信息；对所述目标注意力信息进行解码，得到预测文本。本申请通过图像特征和用于描述图像上下文语境的非图像特征的双向交互，可获得更加准确的注意力信息，进而得以输出贴合待预测图像的图像内容的预测文本。

技术关键词

视觉特征图像文本生成方法语义特征语义注意力解码器文本生成装置数据处理器可读存储介质计算机程序产品音频特征注意力机制解码模块编码模块

系统为您推荐了相关专利信息

一种可识别位置角度的仓库货位检测方法

搬运机器人仓库货位坐标系相机图像像素

一种卷烟条盒胶点的图像检测系统

视觉采集装置图像检测系统 PLC控制器工控机卷烟

医学图像处理方法、装置、电子设备及存储介质

甲状腺超声图像医学图像处理方法图像处理模型轮廓区域医学图像处理装置

一种多模态试题知识点标注方法，系统、设备和存储介质

文本特征向量图像特征向量知识点标注方法知识点标签特征提取网络

烟叶病虫害识别方法和系统

病虫害多模态特征融合融合特征烟叶图像农业设备

一种文本生成方法、装置及相关设备

站点导航

APP 下载