一种题目的识别方法

AITNT
正文
推荐专利
一种题目的识别方法
申请号:CN202410807768
申请日期:2024-06-21
公开号:CN118781612A
公开日期:2024-10-15
类型:发明专利
摘要
本申请公开了一种题目的识别方法,涉及图像数据处理领域,包括:获取图像数据;采用基于连通区域分析算法对图像数据进行划分,得到多个切片图像,每个切片图像仅包含单个题目图像;采用基于文本行间距、字体大小和文本框位置的算法提取切片图像的题目特征,题目特征包含题型和选项个数;根据提取的题目特征,采用贝叶斯分类算法对切片图像进行分类;采用光学字符识别算法提取图像数据中的公式信息;利用数学公式识别算法将提取的公式信息转换为MathML或LaTeX格式的数据;对分类后的切片图像中的公式信息进行修正。针对现有技术中存在的题目区域提取精度低问题,本申请通过图像分割、特征提取和公式修正等,提高了题目识别的精度。
技术关键词
像素点 切片 识别方法 规则知识库 光学字符识别 语义特征 题目图像 贝叶斯分类算法 数学公式识别 自然语言 文本行 数据 Sobel边缘检测 坐标 语法特征 灰度直方图 文本区域检测
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号