一种文字提取与处理方法

AITNT
正文
推荐专利
一种文字提取与处理方法
申请号:CN202411827869
申请日期:2024-12-12
公开号:CN119763131A
公开日期:2025-04-04
类型:发明专利
摘要
本发明公开了一种文字提取与处理方法,涉及信息处理技术领域,本发明收集包含文字的图像数据集,并对每个图像标注文字区域的边界框,将视频文件解码为一系列视频帧,并采样其中的帧作为输入,基于YOLO或Faster R‑CNN目标检测算法配置相应的模型架构和超参数,基于优化后的模型进行文字区域和视频帧的推理,获取文字区域的边界框位置和类别信息,基于深度学习的OCR模型对预处理后的文字区域图像进行文字识别,获取文字的文本内容并对文本内容进行后处理。无需手动标注或设定阈值,减少了人工工作量和主观因素的影响,减少主观性和人为干预,同时同样适用于视频数据,通过对视频帧进行逐帧处理或关键帧提取的方式,实现对视频中的文字区域的检测。
技术关键词
文字区域图像 视频帧 检测模型训练 文本 信息处理技术 人工工作量 训练集数据 解码视频 算法 纠正错误 网络架构 关键帧 格式化 时序 超参数
系统为您推荐了相关专利信息
1
用于数据集语义质量评估的方法及装置、电子设备
语义向量 综合语义 文本 语义特征提取 电子设备本体
2
图像编辑痕迹识别及其模型训练方法、计算机存储介质及程序产品
痕迹特征 编辑 图像采集设备 图像训练样本 计算机存储介质
3
基于多模态融合的轻量化输电终端隐患识别方法、装置、电子设备及存储介质
分支 文本 教师 跨模态 学生
4
一种消化内科电子数据分析方法
图像特征向量 Softmax函数 多层感知机 图像处理模型 注意力
5
一种数字人交互方法、装置及电子设备
人交互方法 关键词 语义理解模型 交互内容 意图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号