一种基于GPT-4o的智能OCR方法和系统

AITNT
正文
推荐专利
一种基于GPT-4o的智能OCR方法和系统
申请号:CN202510220706
申请日期:2025-02-27
公开号:CN120301990A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种基于GPT‑4o的智能OCR方法和系统,所述方法包括:获取视频第一图像帧和第二图像帧,根据光流算法计算光流场,从光流场中提取第二图像帧相对于第一图像帧的全局运动参数;根据全局运动参数构建反向运动补偿矩阵,利用反向运动补偿矩阵对第二图像帧进行反向运动补偿,得到补偿后的第三图像帧;对第一图像帧和第三图像帧进行重叠分割,使得重叠的图像区块大小符合GPT‑4o的图像输入尺寸;对重叠的图像区块进行校正,并将经过校正的重叠的图像区块输入到GPT‑4o中进行OCR识别;将OCR识别的文字结果按照边缘重叠像素匹配的拼接算法进行文字的拼接,并按照拼接的文字顺序分别输出文字结果。
技术关键词
拼接算法 像素点 透视变换矩阵 光流场计算方法 光流算法 视频帧 校正 运动 参数提取方法 OCR系统 边缘检测算子 可读存储介质 迭代方法 图像分割
系统为您推荐了相关专利信息
1
一种基于多项式拟合的侧扫声呐镶嵌成图方法及系统
成图方法 多项式 数据 坐标 侧扫声呐
2
一种基于图像处理的奶粉质量检测方法及系统
像素点 代表 邻域 层次聚类算法 识别杂质
3
基于三维视觉的电连接器插头缩针检测方法
特征点 像素点 电连接器插头 坐标 双目相机
4
一种基于多模态对话模型的中医药知识AI问答方法
多模态对话 深度神经网络 脉象数据 数值 问答方法
5
基于半导体抓料机构用自适应抓取系统及方法
抓料机构 抓取系统 半导体 图像采集模块 中央控制模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号