摘要
本发明涉及金融、医疗健康及人工智能技术领域,提供一种视频帧提取方法、装置、设备及介质,能够基于跨域增强一致性机制进行自监督端到端训练而得到视频帧提取模型,结合跨域增强一致性正则化与自监督学习,提升了关键帧选择在多变条件下的适应性与鲁棒性,无需目标域标注数据,在保持时空连贯性的同时实现了跨域鲁棒的关键帧提取;利用视频帧提取模型中的预处理模块得到目标时空立方体,引入了时序上下文信息,便于捕捉帧间动态关系;利用域自适应特征编码器得到时序增强特征,实现了多尺度时序建模,保持帧间时间连贯性;基于动态阈值筛选目标帧,能够根据场景复杂度自动优化筛选粒度,从而提高关键帧提取的准确性和适应性。
技术关键词
视频帧提取方法
时序
立方体
编码器
计算机设备
动态
关键帧
注意力
滑动窗口机制
生成多尺度
特征提取单元
可读存储介质
人工智能技术
指令
多层感知机
医疗健康
系统为您推荐了相关专利信息
优化控制方法
数字孪生模型
温室
水肥
优化控制系统
布局优化方法
特征点
热电偶
有限元仿真方法
密度聚类算法