摘要
本发明涉及人工智能技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于时序性能增益的训练与处理方法、装置、设备及介质,包括:获取视频样本生成视频熵因子以调整奖励强度并形成训练流程,构建有序帧与打乱帧内容生成回答结果,对比回答结果得到时序性能增益,结合奖励强度与时序性能增益生成奖励信号,输入策略优化过程更新策略参数并处理训练流程生成训练输出,更新训练模型直至获得目标模型,利用目标模型完成任务。本发明通过视频熵因子突出复杂样本,结合时序性能增益强化跨帧推理,使奖励信号同时体现样本难度与时序差异,避免模型依赖单帧,提升视频推理的稳定性和泛化能力。
技术关键词
时序
视频
时间校正
因子
模型更新
强度
策略更新
运动
信号
语义
参数
计算机设备
场景
复杂度
样本
序列
人工智能技术
模块
医疗健康
系统为您推荐了相关专利信息
数据分类模型
数据中心
特征提取模型
元素
时序特征
煤岩
三维动态可视化
裂纹扩展速率
多尺度特征提取
裂纹尖端应力强度因子
电网优化调度方法
微电网系统
有功功率
鲸鱼优化算法
发电机
粒子滤波器
烟丝样品
视觉
动态更新
可读存储介质
大气污染监测方法
控制中心
多无人机
无人机协同监测
无人机数据采集