摘要
本公开关于对象表征模型训练方法、对象表征方法及相关设备,该方法包括:获取各样本对象在不同域的多模态数据;样本对象在每个域的多模态数据包括对象图像数据和该样本对象对应的对象描述文本;将样本对象在每个域的多模态数据分别输入至待训练的对象表征模型的编码网络进行编码处理,得到样本对象在每个域的多模态编码特征;将样本对象在每个域的多模态编码特征分别输入至待训练的对象表征模型的特征交互网络进行每个域的多模态特征交互,得到样本对象在每个域的多模态全局特征;基于各样本对象在不同域的多模态全局特征,对待训练的对象表征模型进行机器学习训练,得到训练好的所述对象表征模型。本公开提升了跨域对象表征的准确性。
技术关键词
对象图像数据
编码特征
样本
语音识别文本
交互网络
模型训练方法
机器学习训练
图像视觉特征
表征方法
视频
预测类别
多模态特征
多模态交互
系统为您推荐了相关专利信息
训练样本数据
测试用例集
数据生成模型
生成提示词
答案
发射参数优化方法
绳网系统
多项式
灵敏度分析方法
发射系统
量子令牌
编码特征
量子加密算法
量子随机数生成器
轨迹