一种视频转化文本的方法、系统、装置及介质

AITNT
正文
推荐专利
一种视频转化文本的方法、系统、装置及介质
申请号:CN202411946794
申请日期:2024-12-27
公开号:CN119888744A
公开日期:2025-04-25
类型:发明专利
摘要
本发明属于图像识别技术领域,公开了一种视频转化文本的方法、系统、装置及介质,包括:采集包含图书内容的视频信息,并对视频信息进行预处理;将预处理后的视频进行逐帧转换,获取若干张图片;对所获取的图片进行筛选,获取单位时间戳内的图片质量最优的图像;对图片质量最优的图像进行识别,获得文本信息。本发明提升了OCR技术在处理视频中的图书信息时的准确性,有效克服了传统OCR技术难以识别动态视频画面中文字信息的难题,这不仅拓宽了OCR技术的应用范围,同时也极大提升了OCR技术的适用度和实用性。
技术关键词
图片 视频 文本 图书 图像识别技术 正确率 识别模块 可读存储介质 像素 处理器 邻域 终端设备 存储器 计算机 多媒体 码率 分辨率
系统为您推荐了相关专利信息
1
文本到图像生成模型的黑盒攻击方法及装置
图像生成模型 文本生成图像 同义词 预训练语言模型 文本编码器
2
基于少样本的接触网弹性定位器支座小目标缺陷检测算法
缺陷检测算法 定位器 接触网 样本 清晰轮廓
3
对话回复的生成方法、装置、设备、存储介质和程序产品
场景 意图识别模型 文本 生成方法 对象
4
用于生成数据模型的方法、装置及存储介质
合规策略 字段 数据项 目录 机器可读存储介质
5
一种实时语音的智能客服系统及方法
智能客服系统 实时语音 客户信息管理 文本 个性化服务单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号