摘要
本发明属于图像识别技术领域,公开了一种视频转化文本的方法、系统、装置及介质,包括:采集包含图书内容的视频信息,并对视频信息进行预处理;将预处理后的视频进行逐帧转换,获取若干张图片;对所获取的图片进行筛选,获取单位时间戳内的图片质量最优的图像;对图片质量最优的图像进行识别,获得文本信息。本发明提升了OCR技术在处理视频中的图书信息时的准确性,有效克服了传统OCR技术难以识别动态视频画面中文字信息的难题,这不仅拓宽了OCR技术的应用范围,同时也极大提升了OCR技术的适用度和实用性。
技术关键词
图片
视频
文本
图书
图像识别技术
正确率
识别模块
可读存储介质
像素
处理器
邻域
终端设备
存储器
计算机
多媒体
码率
分辨率
系统为您推荐了相关专利信息
图像生成模型
文本生成图像
同义词
预训练语言模型
文本编码器
智能客服系统
实时语音
客户信息管理
文本
个性化服务单元