摘要
本申请公开了一种任务处理方法及相关装置,涉及数据处理技术领域,方法包括:获取目标任务的任务数据,目标任务为基于图像的文本生成任务,任务数据包括目标图像;对目标图像进行实例分割,得到目标图像中每个实例的边界框;获取目标图像的全局视觉特征,根据目标图像和获得的边界框,获取目标图像中每个实例的实例特征;根据全局视觉特征以及各实例的实例特征,生成目标文本。本申请公开的任务处理方法,保留了图像中实例的完整性,一方面获取图像的全局视觉特征,另一方面获取图像中各实例的实例特征,如此可获得多粒度视觉表示,根据多粒度视觉表示能够生成较为准确的目标文本。
技术关键词
全局视觉特征
实例分割
文本
融合特征
计算机可读指令
电子设备
数据获取模块
语义
图像块
计算机存储介质
存储计算机程序
序列
数据处理技术
计算机程序产品
处理器
系统为您推荐了相关专利信息
相似性检测方法
指纹特征
计算机软件数据处理
项目
科技
文本处理方法
问答模型
语义实体
模块
计算机可执行指令
视觉词汇表
图像编码器
身份验证机制
积层
服务器