摘要
本发明实施例涉及视频处理技术领域,公开了一种金融视频的理解式提取方法、装置、设备及存储介质,方法为获取待处理金融视频中与金融信息相关的目标帧集合;对目标帧集合进行采样处理,得到关键帧集合;针对关键帧集合中每个关键帧,利用OCR模型提取关键帧中的字段信息集合,得到关键帧对应的字段信息集合;利用帧间信息聚合技术对总字段信息集合进行聚合处理,得到目标文本,总字段信息集合包括关键帧集合中各关键帧对应的字段信息集合。利用采样处理,从目标帧集合中筛选出关键集合,大大减少了处理的帧数量,提高了提取效率。利用帧间信息技术整合多个关键帧的字段信息集合,从多个关键帧中选出正确率最高的字段信息,提高了目标文本的准确性。
技术关键词
关键帧
视频帧集合
金融
字符检测模型
文本检测模型
文本识别模型
字段
图像
处理器通信
采样模块
正确率
可读存储介质
存储器
策略
坐标
系统为您推荐了相关专利信息
视频图像帧序列
泡沫
隶属度函数
关键帧
最佳采样时间
图像
数据标注方法
多模态
计算机设备
对象检测模型
数据库查询语句
语义
自然语言文本
终端设备
大语言模型
室内移动机器人
关键帧
注意力机制
环境图像信息
编码
申威平台
金融
数据库软件系统
风控规则引擎
中间件