摘要
本发明涉及人工智能技术领域,公开了目标编码器训练方法、装置、计算机设备及存储介质,方法包括:获取预处理的训练样本,训练样本包括文本内容、文本内容对应的目标框位置和文本内容的类别;基于文本内容、文本内容对应的目标框位置和文本内容的类别为预处理的训练样本添加位置编码信息,获得目标训练样本;将目标训练样本输入预设编码器,获得第一特征值;将预处理的训练样本输入至预设图片编码器,获得第二特征值;基于第一特征值和第二特征值,确定第一特征值与第二特征值之间的第一损失函数;基于第一损失函数,对预设图片编码器进行参数调优,以获得预训练的图片编码器。本发明减少了大型视觉语言模型进行文本理解的时间消耗。
技术关键词
编码特征
特征值
文本编码器
图片
位置编码信息
矩阵
计算机设备
编码器训练
文本理解
可读存储介质
参数
人工智能技术
模块
存储器
像素
处理器
指令
系统为您推荐了相关专利信息
图像三维重建方法
重建三维模型
三维结构
三维重建模型
正交图像
渲染服务器
图片
云渲染方法
软硬件配置信息
生成虚拟机
对象
康复需求
运动状态评估
策略生成方法
贝叶斯网络模型
智能化检测方法
图像
交叉注意力机制
对象
投影结构