摘要
本发明涉及一种基于标注质量和奖励偏差的视频描述方法、系统及介质,方法包括以下步骤:提取目标视频的视频特征;使用层次式视觉网络对视频特征进行编码,得到多级视频编码特征;通过视频描述生成模型将多级视频编码特征解码,获取视频描述结果;视频描述生成模型训练步骤包括:通过综合评分模块对视频标注质量进行综合评估,根据综合评估分数鼓励视频描述生成模型向高质量标注学习,并抑制低质量标注引入的噪声干扰;通过自审查模块基于强化学习算法计算每一条视频描述的偏差奖励,并根据偏差奖励估计每一条预测描述的预期奖励收益,通过预期奖励收益指引视频描述生成模型进行优化。与现有技术相比,本发明提升了视频描述的准确性和语义丰富度。
技术关键词
视频编码
偏差
强化学习算法
语句
模块
上存储计算机程序
视频特征提取
视觉
可读存储介质
噪声
网络
解码
矩阵
指标
序列
语义
系统为您推荐了相关专利信息
智能决策引擎
智能仓储
决策系统
数字孪生模型
仓储作业
无监督机器学习
初始聚类中心
分类方法
校准
算法