摘要
本发明公开了一种强化的人类视频消光模型设计方法、设备及介质,属于人工智能技术领域,用于解决现有的人类视频消光技术,在处理动态背景或摄像头视角变化时存在局限性,需要一定的人工参与成本,且未能充分利用时域信息的技术问题。方法包括:对包含人物特征的多类别视频数据进行数据采集处理,得到多维数据集;对模型训练数据集中的输入图像进行基于特征编码模块的前馈网络结构编码计算处理,得到卷积深层特征图谱;将卷积深层特征图谱进行并置操作,对特征解码模块进行输入以及输出控制,并对其余深层特征图谱进行通道拆分与并置操作,得到最终深层特征图谱;通过人类视频消光模型,完成对待处理人物特征视频数据的内容信息提取。
技术关键词
图谱
模型设计方法
编码模块
人物特征
视频
数据
解码模块
链接模块
人类
动态背景
双线性插值
非易失性计算机可读存储介质
非易失性计算机存储介质
网络结构
残差模块
消光技术
门控循环单元
全局平均池化
通道
系统为您推荐了相关专利信息
语音问答系统
意图识别
语音语料库
服务机器人
判别模块
监管方法
语义
多模态数据融合
生成语音
视频分析
信息交互方法
媒体
融合图像数据
数据生成模型
生成融合图像
空调运行参数
制冷控制方法
风机运行频率
因子
制冷控制系统
大语言模型
智能决策方法
计算机可读指令
三元组
实体