基于光学字符识别的文档内容处理方法、设备和存储介质

AITNT
正文
推荐专利
基于光学字符识别的文档内容处理方法、设备和存储介质
申请号:CN202411723089
申请日期:2024-11-28
公开号:CN119580277A
公开日期:2025-03-07
类型:发明专利
摘要
本申请涉及人工智能技术领域,提供了基于光学字符识别的文档内容处理方法,该方法包括:将原文档转换为图像;预设算法对转换所得图像中的字符进行处理,识别图像中的文本内容;基于自然语言处理技术解析从图像中识别的文本内容,识别其中的语义和格式结构;根据识别出的语义和格式结构重建文档,得到在视觉上其内容与原文档的内容一致的目标文档。本申请的技术方案可以保证字符识别的精确和高效,重建无风险的文档。
技术关键词
光学字符识别 格式结构 文本 图像处理技术 自然语言 紧凑特征 视觉特征 语义 二值化图像 加权特征 识别模块 生成文字 人工智能技术 解码器 处理器 算法
系统为您推荐了相关专利信息
1
一种基于自适应选择性掩码的领域预训练的新闻分类方法
新闻分类方法 预训练模型 噪声标签 掩码策略 标记
2
车辆故障确定方法、电子设备及车辆
语义向量 故障分析模型 置信度阈值 车辆 信号
3
水印植入、检测方法、服务端、可信第三方、介质及产品
服务端 水印检测方法 种子 大语言模型 令牌
4
一种原文拆解和标签识别方法、系统、设备及存储介质
标签识别方法 计算机可执行指令 实体识别模型 预训练模型 文本
5
一种公共卫生事件中虚假信息的识别系统
公共卫生事件 像素点 识别系统 贡献率 信息处理模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号