图像描述文本的处理方法及装置、电子设备、存储介质及计算机程序产品

正文

推荐专利

申请号：CN202510637111

申请日期：2025-05-16

公开号：CN120508670A

公开日期：2025-08-19

类型：发明专利

摘要

本公开关于一种图像描述文本的处理方法及装置、电子设备、存储介质及计算机程序产品。该处理方法包括：对原始图像的初始描述文本进行分词处理，得到初始描述文本的分词结果；将分词结果输入文本编码器，得到离散向量和连续向量；对连续向量进行预定步数的加噪和去噪处理，其中，在预定步数中的每一步，利用当前步的预测噪声和当前步加入的随机噪声更新当前步的离散向量，并将更新后的离散向量作为下一步的离散向量，将下一步的离散向量对应的连续向量作为下一步的连续向量；响应于预定步数的加噪和去噪处理完成，基于每一步更新后的离散向量，确定原始图像的最终描述文本。

技术关键词

文本编码器随机噪声图像分词计算机程序产品中间层噪声预测处理器计算机可执行指令电子设备可读存储介质数据语义

图像描述文本的处理方法及装置、电子设备、存储介质及计算机程序产品

站点导航

APP 下载