一种基于语义协同和表征挖掘的视频文本识别方法

正文

推荐专利

申请号：CN202510652381

申请日期：2025-05-20

公开号：CN120526414A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开一种基于语义协同和表征挖掘的视频文本识别方法，包括以下步骤：选取视频帧，构建视频文本识别数据集；通过文本检测网络获取文本的位置信息和检测分数；通过语义协同分类器获得文本的识别内容和语义分数，并利用特征挖掘模块对其进行辅助监督；利用检测分数和识别分数加权平均后的协同分数，筛选出高质量文本实例，并对其位置信息和语义信息进行对齐和融合，作为跟踪表征；将高质量文本区域和跟踪表征输入到文本跟踪模块获取跟踪ID，并结合检测位置和识别内容，确定待识别视频的文本识别结果。本发明方法，能够实现视频文本中小弱文本区域和类文本区域的准确识别，提升模型对于外部环境视觉干扰的鲁棒性。

技术关键词

语义协同文本识别方法分类器文本分割方法网络语义特征样本模块视频帧编码图像多层感知机视觉特征融合特征标签中心线

系统为您推荐了相关专利信息

一种基于人工智能的生猪免疫功能预测系统及方法

生猪免疫功能肠道菌群检测功能性氨基酸预测系统标志物

一种数字人直播视频合成方法及系统

视频管理系统资源管理系统用户多模态语音特征提取

一种基于深度强化学习的无人机集群一致性决策系统及方法

无人机集群混合网络仿真平台决策系统网络优化器

飞行器轨迹解算方法、装置、模型训练方法和程序产品

飞行器解算方法模型训练方法数值积分方法损失函数设计

一种输变电工程数字化监控方法

数字化监控方法输变电工程设备组设备状态数据时间差

一种基于语义协同和表征挖掘的视频文本识别方法

站点导航

APP 下载