一种视频转化文本的方法、系统、装置及介质

正文

推荐专利

申请号：CN202411946794

申请日期：2024-12-27

公开号：CN119888744A

公开日期：2025-04-25

类型：发明专利

摘要

本发明属于图像识别技术领域，公开了一种视频转化文本的方法、系统、装置及介质，包括：采集包含图书内容的视频信息，并对视频信息进行预处理；将预处理后的视频进行逐帧转换，获取若干张图片；对所获取的图片进行筛选，获取单位时间戳内的图片质量最优的图像；对图片质量最优的图像进行识别，获得文本信息。本发明提升了OCR技术在处理视频中的图书信息时的准确性，有效克服了传统OCR技术难以识别动态视频画面中文字信息的难题，这不仅拓宽了OCR技术的应用范围，同时也极大提升了OCR技术的适用度和实用性。

技术关键词

图片视频文本图书图像识别技术正确率识别模块可读存储介质像素处理器邻域终端设备存储器计算机多媒体码率分辨率

系统为您推荐了相关专利信息

文本到图像生成模型的黑盒攻击方法及装置

图像生成模型文本生成图像同义词预训练语言模型文本编码器

基于少样本的接触网弹性定位器支座小目标缺陷检测算法

缺陷检测算法定位器接触网样本清晰轮廓

对话回复的生成方法、装置、设备、存储介质和程序产品

场景意图识别模型文本生成方法对象

用于生成数据模型的方法、装置及存储介质

合规策略字段数据项目录机器可读存储介质

一种实时语音的智能客服系统及方法

智能客服系统实时语音客户信息管理文本个性化服务单元

一种视频转化文本的方法、系统、装置及介质

站点导航

APP 下载