摘要
本申请公开了一种实时人类视频消光模型的训练方法,其中方法包括:采集应用数据,并基于应用数据生成训练数据集;将训练数据集输入至预设初始模型中,得到当前模型参数下训练数据集对应的输出集合;预设初始模型内设置语义和细节预测高低分辨率可逆分支,语义和细节预测高低分辨率可逆分支与编码器相连,输出高分辨率细节预测输出以及低分辨率语义估计输出;基于输出集合,确定当前模型参数下对应的损失函数值;调整预设初始模型中的模型参数,直至损失函数值低于预设阈值。在RVM编码阶段引入仅参与模型的训练过程的可逆分支,在不增加模型推理规模的情况下,实现编码器对视频空域中浅层细节信息和深度语义信息的充分提取。
技术关键词
图谱
编码模块
语义
门控循环单元
解码模块
线性单元
生成训练数据
分辨率
编码器
双线性插值
参数
分支
解码器
图像
视频
员工
网络
展厅
系统为您推荐了相关专利信息
问答场景
意图识别方法
神经网络模型识别
数据
频谱特征
足底压力传感器
数据采集板
云服务器
GPS定位模块
网络模块
文本实体识别
图像处理方法
关系
光学字符识别
编码向量
钓鱼邮件检测方法
关键词特征
解析邮件
语义
身份认证协议
联合检测方法
对象
计算机可执行指令
关系
多模态