一种基于GPT-4o的智能OCR方法和系统

正文

推荐专利

申请号：CN202510220706

申请日期：2025-02-27

公开号：CN120301990A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了一种基于GPT‑4o的智能OCR方法和系统，所述方法包括：获取视频第一图像帧和第二图像帧，根据光流算法计算光流场，从光流场中提取第二图像帧相对于第一图像帧的全局运动参数；根据全局运动参数构建反向运动补偿矩阵，利用反向运动补偿矩阵对第二图像帧进行反向运动补偿，得到补偿后的第三图像帧；对第一图像帧和第三图像帧进行重叠分割，使得重叠的图像区块大小符合GPT‑4o的图像输入尺寸；对重叠的图像区块进行校正，并将经过校正的重叠的图像区块输入到GPT‑4o中进行OCR识别；将OCR识别的文字结果按照边缘重叠像素匹配的拼接算法进行文字的拼接，并按照拼接的文字顺序分别输出文字结果。

技术关键词

拼接算法像素点透视变换矩阵光流场计算方法光流算法视频帧校正运动参数提取方法 OCR系统边缘检测算子可读存储介质迭代方法图像分割

系统为您推荐了相关专利信息

一种基于多项式拟合的侧扫声呐镶嵌成图方法及系统

成图方法多项式数据坐标侧扫声呐

一种基于图像处理的奶粉质量检测方法及系统

像素点代表邻域层次聚类算法识别杂质

基于三维视觉的电连接器插头缩针检测方法

特征点像素点电连接器插头坐标双目相机

一种基于多模态对话模型的中医药知识AI问答方法

多模态对话深度神经网络脉象数据数值问答方法

基于半导体抓料机构用自适应抓取系统及方法

抓料机构抓取系统半导体图像采集模块中央控制模块

一种基于GPT-4o的智能OCR方法和系统

站点导航

APP 下载