摘要
本公开提供了信息定位及其模型训练方法、装置、设备、介质及产品,涉及计算机技术领域,尤其涉及深度学习、智能搜索、多模态内容理解等技术领域。具体实现方案为:获取训练样本,训练样本包括样本视频、样本视频对应的多个样本语句以及在样本视频中与样本语句对应的样本定位信息;根据样本视频的样本视觉特征和多个样本语句的样本文本特征确定样本视频的样本强化特征;基于样本强化特征、多个样本语句的样本文本特征以及样本定位信息,调整模型参数,得到训练后的信息定位模型。在本方案中,利用一个样本视频对应多个样本语句进行训练,可有效减少训练耗时,提高训练效率,同时兼顾一个样本视频中多个样本语句的语义信息,提高模型的特征表征能力。
技术关键词
样本
强化特征
视觉特征
语句
视频
融合特征
变换文本
模型训练方法
信息定位装置
信息定位方法
数据
计算机程序产品
参数
训练装置
处理器通信
信息更新
指令
系统为您推荐了相关专利信息
多屏同步方法
同步控制器
主节点
设备标识符
网络拓扑变化
动态特征提取
车载CAN总线
入侵检测系统
网络模型训练
彩色图像