摘要
本发明公开了一种基于强化学习的数据感知单模态采样方法及攻击性表达检测系统,方法包括:处理原始样本为原始样本序列,并构建多模态深度学习模型;将原始样本序列输入至多模态深度学习模型得到预测结果并计算累积模态差异分数;构建强化学习策略网络的决策系统,定义智能体、环境、状态、动作、奖励函数;将累积模态差异分数输入策略网络,得到下一轮采样数据量,并依照奖励函数更新策略网络;最后根据多模态深度学习模型的预测结果计算损失,进行参数更新以训练模型。本发明通过基于强化学习的单模态采样方法,缓解模态不均衡问题,训练得到优秀的多模态模型,提升多模态模型在分类下游任务的模型性能,可作为攻击性表达检测系统的核心方法。
技术关键词
多模态深度学习
强化学习策略
采样方法
深度学习模型
决策系统
分类网络
定义
数据
样本
序列
图文
强化学习模型
处理器
生成动作
计算机程序产品
非线性
实体
系统为您推荐了相关专利信息
色彩管理
辅助系统
深度卷积神经网络预测
多光谱成像设备
图像采集模块
强化学习策略
水印嵌入方法
水印检测器
后处理模块
比特流
干扰补偿方法
深度学习模型
高精度温度传感器
偏差
传感器老化
两栖机器人
组合导航方法
深度学习模型
视觉传感器
AI算法